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1.1. 目 标 


© 回顾 计算 机 科学 的 思想 , 提高 编程 和 解决 问题 的 能 力 。 
o 理解 抽象 化 以 及 它 在 解决 问题 过 程 中 发 挥 的 作用 

o 理解 和 实现 抽象 数据 类 型 的 概念 

e 回顾 Python 编程 语言 


1.2. 快 速 开 始 


从 第 一 台 通 过 接 入 网 线 和 交换 机 来 传递 人 的 指令 的 计算 机 开始 ， 我 们 编程 思考 的 方式 发 生 了 
许多 变化 。 与 社会 的 许多 方面 一 样 ， 计 算 技术 的 变化 为 计算 机 科学 家 提供 了 越 来 越 多 的 工具 
和 平台 来 实践 他 们 的 工艺 。 计 算 机 的 快速 发 展 诸如 更 快 的 处 理 器 ， 高 速 网 络 和 大 的 存储 器 容 
量 已 经 让 计算 机 科学 家 陷入 高 度 复 杂 螺 旋 中 。 在 所 有 这 些 快速 演变 中 ， 一 些 基 本 原则 保持 不 
变 。 计 算 机 科学 关注 用 计算 机 来 解决 问题 。 


毫 无 疑问 你 花 了 相当 多 的 时 间 学 习 解 决 问题 的 基础 知识 ， 以 此 希望 有 足够 的 能 力 把 问题 形 清 
楚 并 想 出 解决 方案 。 你 还 发 现 编写 代码 通常 很 困难 。 问 题 的 复杂 性 和 解决 方案 的 相应 复杂 性 
往往 会 掩盖 与 解决 问题 过 程 相关 的 基本 思想 。 


本 章 着 重 介绍 了 其 他 两 个 重要 的 部 分 。 首 先 回 顾 了 计算 机 科学 与 算法 和 研究 数据 结构 所 必须 
适应 的 框架 ， 特 别 是 我 们 需要 研究 这 些 主题 的 原因 ， 以 及 如 何 理解 这 些 主题 有 助 于 我 们 更 好 
的 解决 问题 。 第 二 ， 我 们 回顾 Python 编程 语言 。 虽 然 我 们 不 提供 详尽 的 参考 ， 我 们 将 在 其 余 
章节 中 给 出 基本 数据 结构 的 示例 和 解释 。 


1.3. 什 么 是 计算 机 科学 


计算 机 科学 往往 难以 定义 。 这 可 能 是 由 于 在 名 称 中 不 幸 使 用 了 "计算 机 ?一 词 。 正 如 你 可 能 知道 
的 ， 计 算 机 科学 不 仅仅 是 计算 机 的 研究 。 虽 然 计 算 机 作为 一 个 工具 在 学 科 中 发 挥 重 要 的 支持 
作用 ， 但 它们 只 是 工具 。 


计算 机 科学 是 对 问题 ， 解 决 问题 以 及 解决 问题 过 程 中 产生 的 解决 方案 的 研究 。 给 定 一 个 问 
题 ， 计 算 机 科学 家 的 目标 是 开发 一 个 算法 ， 一 系列 的 指令 列表 ， 用 于 解决 可 能 出 现 的 问题 的 
任何 实例 。 算 法 遵循 它 有 限 的 过 程 就 可 以 解决 问题 。 


计算 机 科学 可 以 被 认为 是 对 算法 的 研究 。 但 是 ， 我 们 必须 说 懂 地 包括 一 些 事 实 ， 即 一 些 问题 
可 能 没有 解决 方案 。 虽 然 证 明 这 种 说 法 正确 性 超出 了 本 文 的 范围 ， 但 一 些 问题 不 能 解决 的 事 
实 对 于 那些 研究 计算 机 科学 的 人 是 很 重要 的 。 所 以 我 们 可 以 这 么 定义 计算 机 科学 ， 是 研究 能 
被 解决 的 问题 的 方案 和 不 能 被 解决 问题 的 科学 。 


通常 我 们 会 说 这 个 问题 是 可 计算 的 ， 当 在 描述 问题 和 解决 方案 时 。 如 果 存 在 一 个 莫 法 解决 这 
个 问题 ， 那 么 问题 是 可 计算 的 。 计 算 机 科学 的 另 一 个 定义 是 说 ， 计 算 机 科学 是 研究 那些 可 计 
算 和 不 可 计算 的 问题 ， 研 究 是 不 是 存在 一 种 算法 来 解决 它 。 你 会 注意 到 ，“ 电 脑 ” 一 词根 本 没有 
出 现 。 解 决 方案 是 独立 于 机 器 而 言 的 。 


计算 机 科学 ， 因 为 它 涉及 问题 解决 过 程 本 身 ， 也 是 抽象 的 研究 。 抽 象 使 我 们 能 够 以 分 离 所 谓 
的 逻辑 和 物理 角度 的 方式 来 观察 问题 和 解决 方案 。 基 本 思想 跟 我 们 常见 的 例子 一 样 。 


假设 你 可 能 已 经 开车 上 学 或 上 班 。 作 为 司机 ， 汽 车 的 用 户 。 你 为 了 让 汽车 载 你 到 目的 地 ， 你 
会 和 汽车 有 些 互 动 。 进 入 汽车 ， 插 入 钥匙 ， 点 火 ， 换 挡 ， 制 动 ， 加 速 和 转向 。 从 抽象 的 角 
度 ， 我 们 可 以 说 你 所 看 到 的 是 汽车 的 逻辑 视角 。 你 正在 使 用 汽车 设计 师 提供 的 功能 ， 将 你 从 
一 个 地 方 运输 到 另 一 个 位 置 。 这 些 功能 有 时 也 被 称 为 接口 。 


另 一 方面 ， 修 理 汽车 的 技工 有 一 个 截然 不 同 的 视角 。 他 不 仅 知 道 如 何 开 车 ， 还 必须 知道 所 有 
必要 的 细节 ， 使 我 们 认为 理所当然 的 功能 运行 起 来 。 他 需要 了 解 发 动机 是 如 何 工作 的 ， 变 速 
箱 如 何 变速 ， 温 度 是 如 何 控制 的 等 等 。 这 被 称 为 物理 视角 ， 细 节 发 生 在 “引擎 盖 下 "。 


当 我 们 使 用 电脑 时 也 会 发 生 同样 的 情况 。 大 多 数 人 使 用 计算 机 写 文 档 ， 发 送 和 接收 电子 邮 
件 ， 上 网 冲浪 ， 播 放 音 乐 ， 存 储 图 像 和 玩 游 戏 ， 而 不 知道 让 这 些 应 用 程序 工作 的 细节 。 他 们 
从 逻辑 或 用 户 角 度 看 计算 机 。 计 算 机 科学 家 ， 程 序 员 ， 技 术 支 持 人 员 和 系统 管理 员 看 计算 机 
的 角度 截然 不 同 。 他 们 必须 知道 操作 系统 如 何 工 作 的 细节 ， 如 何 配置 网 络 协议 ， 以 及 如 何 编 
写 控制 功能 的 各 种 脚本 。 他 们 必须 能 够 控制 底层 的 细节 。 


这 两 个 示例 的 共同 点 是 用 户 态 的 抽象 ， 有 时 也 称 为 客户 端 ， 不 需要 知道 细节 ， 只 要 用 户 知道 
接口 的 工作 方式 。 这 个 接口 是 用 户 与 底层 沟通 的 方式 。 作 为 抽象 的 另 一 个 例子 ，Python 数学 
模块 。 一 旦 我 们 导入 模块 ， 我 们 可 以 执行 计算 


>>> Import math 
>>> math.sqrt(i6) 
4.0 

>>> 


这 是 一 个 程序 抽象 的 例子 。 我 们 不 一 定 知 道 如 何 计算 平方 根 ， 但 我 们 知道 函数 是 什么 以 及 如 
何 使 用 它 。 如 果 我 们 正确 地 执行 导入 ， 我 们 可 以 假设 该 函数 将 为 我 们 提供 正确 的 结果 。 我 们 
知道 有 人 实现 了 平方 根 问题 的 解决 方案 ， 但 我 们 只 需要 知道 如 何 使 用 它 。 这 有 时 被 称 为 " 黑 盒 
子 "视图 。 我 们 简单 地 描述 下 接口 : 函数 的 名 称 ， 需 要 什么 (参数) ， 以 及 将 返回 什么 。 细 节 


n sqrt( ) square root of n 


隐藏 在 里 面 ( 见 图 1) 。 
(图 1) 


1.4. 什 么 是 编程 


编程 是 将 算法 编码 为 符号 ， 编 程 语言 的 过 程 ， 以 使 得 其 可 以 由 计算 机 执行 。 虽 然 有 许多 编程 
语言 和 不 同类 型 的 计算 机 存在 ， 第 一 步 是 需要 有 解决 方案 。 没 有 章 法 就 没有 程序 。 

计算 机 科学 不 是 研究 编程 。 然 而 ， 编 程 是 计算 机 科学 家 的 一 个 重要 能 力 。 编 程 通常 是 我 们 为 
解决 方案 创建 的 表现 形式 。 因 此 ， 这 种 语言 表现 形式 和 创造 它 的 过 程 成 为 该 学 科 的 基本 部 


o 


3 


算法 描述 了 依据 问题 实例 数据 所 产生 的 解决 方案 和 产生 预期 结果 所 需 的 一 套 步骤 。 编 程 语 言 
必须 提供 一 种 表示 方法 来 表示 过 程 和 数据 。 为 此 ， 它 提供 了 控制 结构 和 数据 类 型 。 


控制 结构 允许 以 方便 而 明确 的 方式 表示 算法 步 又。 至 少 ， 算 法 需要 执行 顺序 处 理 ， 决 策 选 择 
和 重复 控制 和 迭代。 只 要 语言 提供 这 些 基 本 语句 ， 它 就 可 以 用 于 算法 表示 。 


计 和 工 机 中 的 所 有 数据 项 都 以 二 进 制 形式 表示 。 为 了 赋 给 这 些 字符 串 含义 ， 我 们 需要 有 数据 类 
型 。 数 据 类 型 提供 了 对 这 个 二 进 制 数据 的 解释 ， 以 便 我 们 能 够 根据 解决 的 问题 思考 数据 。 这 
些 底层 的 内 置 数据 类 型 (有 时 称 为 原始 数据 类 型 ) 为 算法 开发 提供 了 基础 。 


例如 ， 大 多 数 编程 语言 为 整数 提供 数据 类 型 。 内 存 中 的 二 进 制 数据 可 以 解释 为 整数 ， 并 且 能 
给 予 一 个 我 们 通常 与 整数 【例如 23,654 和 -19) 相关 联 的 含义 。 此 外 ， 数 据 类 型 还 提供 数据 
项 参与 的 操作 的 描述 。 对 于 整数 ， 诸 如 加 法 ， 减 法 和 乘法 的 操作 是 常见 的 。 我 们 期 望 数值 类 
型 的 数据 可 以 参与 这 些 算术 运算 。 通 常 我 们 遇 到 的 困难 是 问题 及 其 解决 方案 非常 复杂 。 这 些 
简单 的 ， 语 言 提供 的 结构 和 数据 类 型 虽然 足以 表示 复杂 的 解决 方案 ， 但 通常 在 我 们 处 理 问题 
的 过 程 中 处 于 不 利 地 位 。 我 们 需要 一 些 方法 控制 这 种 复杂 性 ， 并 能 给 我 们 提供 更 好 的 解决 方 
案 。 


1.5. 为 什么 要 学 习 数 据 结构 和 抽象 数据 类 型 


为 了 管理 问题 的 复杂 性 和 解决 问题 的 过 程 ， 计 算 机 科学 家 使 用 抽象 使 他 们 能 够 专注 于 “大 局 ” 
而 不 会 迷失 在 细节 中 。 通 过 创建 问题 域 的 模型 ， 我 们 能 够 利用 更 好 和 更 有 效 的 问题 解决 过 
程 。 这 些 模型 允许 我 们 以 更 加 一 致 的 方式 描述 我 们 的 章法 将 要 处 理 的 数据 。 


之 前 ， 我 们 将 过 程 抽 象 称 为 隐藏 特定 函数 的 细节 的 过 程 ， 以 允许 用 户 或 客户 端 在 高 层 查 看 

它 。 我 们 现在 将 注意 力 转 向 类 似 的 思想 ， 即 数据 抽象 的 思想 。 抽象 数据 类 型 (有 时 缩写 为 ADT 
) 是 对 我 们 如 何 查看 数据 和 允许 的 操作 的 逻辑 描述 ， 而 不 用 考虑 如 何 实现 它们 。 这 意味 着 我 
们 只 关心 数据 表示 什么 ， 而 不 关心 它 最 终 将 如 何 构造 。 通 过 提供 这 种 级 别 的 抽象 ， 我 们 围绕 
数据 创建 一 个 封装 。 通 过 封装 实现 细节 ， 我 们 将 它们 从 用 户 的 视图 中 隐藏 。 这 称 为 信息 隐 
Ho 


Figure 2 展示 了 抽象 数据 类 型 是 什么 以 及 如 何 操作 。 用 户 与 接口 交互 ， 使 用 抽象 数据 类 型 指 
定 的 操作 。 抽 象 数 据 类 型 是 用 户 与 之 交互 的 shell。 实 现 隐 藏 在 更 深 的 底层 。 用 户 不 关心 实现 
的 细节 。 


Figure 2 


抽象 数据 类 型 (通常 称 为 数据 结构 ) 的 实现 将 要 求 我 们 使 用 一 些 程序 构建 和 原始 数据 类 型 的 
集合 来 提供 数据 的 物理 视图 。 正 如 我 们 前 面 讨论 的 ， 这 两 个 视角 的 分 离 将 允许 我 们 将 问题 定 
义 复 杂 的 数据 模型 ， 而 不 给 出 关于 模型 如 何 实际 构建 的 细节 。 这 提供 了 独立 于 实现 的 数据 视 
图 。 由 于 通常 有 许多 不 同 的 方法 来 实现 抽象 数据 类 型 ， 所 以 这 种 实现 独立 性 允许 程序 员 在 不 
改变 数据 的 用 户 与 其 交互 的 方式 的 情况 下 切换 实现 的 细节 。 用 户 可 以 继续 专注 于 解决 问题 的 
过 程 。 


1.6. 为 什么 要 学 习 算 法 


计算 机 科学 家 经 常 通过 经 验 学习 o 我 们 通过 看 别人 解决 问题 和 自 己 解 决 问题 来 学 习 。 接触 不 
同 的 问题 解决 技术 ， 看 不 同 的 算法 设计 有 助 于 我 们 承担 下 一 个 具有 挑战 性 的 问题 。 通 过 思考 
许多 不 同 的 算法 ， 我 们 可 以 开始 开发 模式 识别 ， 以 便 下 一 次 出 现 类 似 的 问题 时 ， 我 们 能 够 更 
好 地 解决 它 。 


算法 通常 彼此 完全 不 同 。 考 虑 前 面 看 到 的 sqrt 的 例子 。 完 全 可 能 的 是 ， 存 在 许多 不 同 的 方 
式 来 实现 细节 以 计算 平方 根 函 数 。 一 种 算法 可 以 使 用 比 另 一 种 更 少 的 资源 。 一 个 算法 可 能 需 
要 10 倍 的 时 间 来 返回 结果 。 我 们 想 要 一 些 方法 来 比较 这 两 个 解决 方案 。 即 使 他 们 都 工作 ， 一 
个 可 能 比 另 一 个 “更 好 ”。 我 们 建议 使 用 一 个 更 高 效 ， 或 者 一 个 只 是 工作 更 快 或 使 用 更 少 的 内 存 
的 算法 。 当 我 们 研究 算法 时 ， 我 们 可 以 学 习 分 析 技 术 ， 允 许 我 们 仅仅 根据 自己 的 特征 而 不 是 
用 于 实现 它们 的 程序 或 计算 机 的 特征 来 比较 和 对 比 解决 方案 。 


在 最 坏 的 情况 下 > 我 们 可 能 有 一 个 难以 处 理 的 问题 9 这 意味 着 没有 算法 可 以 在 实际 的 时 间 量 
内 解决 问题 。 重 要 的 是 能 够 区 分 具有 解决 方案 的 那些 问题 ， 不 具有 解决 方案 的 那些 问题 ， 以 
及 存在 解决 方案 但 需要 太 多 时 间或 其 他 资源 来 合理 工作 的 那些 问题 。 


经 常 需要 权衡 ， 我 们 需要 做 决定 。 作 为 计算 机 科学 家 ， 除 了 我 们 解决 问题 的 能 力 ， 我 们 还 需 
要 了 解 解决 方案 评估 技术 。 有 和 最 后 ， 通 常 有 很 多 方法 来 解决 问题 。 找 到 一 个 解决 方案 ， 我 们 将 
一 遍 又 一 遍 比 较 ， 然 后 决定 它 是 否 是 一 个 好 的 方案 。 


1.7.21 i Python Æ% 44 


在 本 节 中 ， 我 们 将 回顾 Python 编程 语言 ， 并 提供 一 些 更 详细 的 例子 。 如 果 你 是 Python 新 
手 ， 或 者 你 需要 有 关 提 出 的 任何 主题 的 更 多 信息 ， 我 们 建议 你 参考 Python 语言 参考 或 Python 
教程 。 我 们 在 这 里 的 目标 是 重新 认识 下 python 语言 ， 并 强化 一 些 将 成 为 后 面 章节 中 心 的 概 


WS 


Python 是 一 种 现代 的 ， 易 于 学 习 的 面向 对 象 的 编程 语言 。 它 具有 一 组 强大 的 内 置 数据 类 型 和 
急于 使 用 的 控件 结构 。 由 于 Python 是 一 种 解释 型 语言 ， 因 此 通过 简单 地 查看 和 描述 交互 式 会 
话 ， 更 容易 进行 检查 。 你 应 该 记得 ， 解 释 器 显示 熟悉 的 >>> 提示 ， 然 后 计算 你 提供 的 
Python %4 4 ° Plte > 


>>> print("Algorithms and Data Structures") 
Algorithms and Data Structures 


显示 提示 ， 打 印 结果 和 下 一 个 提示 。 


15 


2.1. 8 75 


。 理解 算法 分 析 的 重要 性 

。 能 够 使 用 大 O 符号 描述 莫 法 执行 时 间 

。 理解 Python 列表 和 字典 的 常见 操作 的 KO 执行 时 间 

。 理解 Python 数据 的 实现 是 如 何 影响 算法 分 析 的 。 

© 了 解 如 何 对 简单 的 Python 程序 做 基准 测试 ( benchmark ) ° 


日 ob A 
2.2. 什 么 是 算法 分 析 
一 些 普遍 的 现象 是 ， 刚 接触 计算 机 科学 的 学 生 会 将 自己 的 程序 和 其 他 人 的 相 比 较 。 你 可 能 还 
注意 到 ， 这 些 计算 机 程序 看 起 来 很 相似 ， 尤 其 是 简单 的 程序 。 经 常 出 现 一 个 有 趣 的 问题 。 当 
两 个 程序 解决 同样 的 问题 ， 但 看 起 来 不 同 ， 哪 一 个 更 好 呢 ? 


为 了 回答 这 个 问题 ， 我 们 需要 记 住 ， 程 序 和 程序 代表 的 底层 算法 之 间 有 一 个 重要 的 区 别 。 正 
如 我 们 在 第 1 章 中 所 说 ， 一 种 算法 是 一 个 通用 的 ， 一 步 一 步 解决 某 种 问题 的 指令 列表 。 它 是 
用 于 解决 一 种 问题 的 任何 实例 的 方法 ， 给 定 特定 输入 ， 产 生 期 望 的 结果 。 另 一 方面 ， 程 序 是 
使 用 某 种 编程 语言 编码 的 算法 。 根 据 程序 员 和 他 们 所 使 用 的 编程 语言 的 不 同 ， 可 能 存在 描述 
相同 算法 的 许多 不 同 的 程序 。 


要 进一步 探讨 这 种 差异 ， 请 参考 ActiveCode 1 中 显示 的 函数 。 这 个 函数 解决 了 一 个 我 们 熟悉 
的 问题 ， 计 算 前 n 个 整数 的 和 。 该 算法 使 用 初始 化 值 为 0 的 累加 器 ( accumulator ) 变量 。 
然后 迭代 n 个 整数 ， 将 每 个 依次 添加 到 累加 器 。 


ActiveCode 1 


def sumOfN(n): 
theSum = 0 
for i in range(1,n+1): 
theSum = theSum + i 


return theSum 


print (sumOfN(10)) 


现在 看 看 ActiveCode 2 F i BAe F—-A > CTAHRAE > (UR-POMR > HTAA SR 
S BRAM LAH A BRAM ENS lo RERARAAT BBD MA o MINKA 
用 良好 的 标识 符 〈 identifier ) 名 称 来 提升 可 读 性 ， 我 们 在 迭代 步骤 中 使 用 了 一 个 额外 的 赋 
值 语句 ， 这 并 不 是 丨 正 必 要 的 。 


ActiveCode 2 


def foo(tom): 
fred = 0 
for bill in range(i, tom+1): 
barney = bill 
fred = fred + barney 


return fred 


print (foo(10)) 


先前 我 们 提出 一 个 问题 是 哪个 函数 更 好 ， 答 案 取 决 于 你 的 标准 。 如 果 你 关注 可 读 性 ， 函 数 
sumOfN 肯定 比 foo 好 。 事 实 上 ， 你 可 能 已 经 在 介绍 编程 的 课程 中 看 到 过 很 多 例子 ， 他 们 的 目 
标 之 一 就 是 帮助 你 编写 易于 阅读 和 理解 的 程序 。 然 而 ， 在 本 课程 中 ， 我 们 对 算法 本 身 的 表示 
更 感 兴 趣 (当然 我 们 希望 你 继续 努力 编写 可 读 的 ， 易 于 理解 的 代码 ) o 


算法 分 析 是 基于 每 种 算法 使 用 的 计算 资源 量 来 比较 算法 。 我 们 比较 两 个 算法 ， en = 
个 算法 好 的 原因 在 于 它 在 使 用 资源 方面 更 有 效率 ， 或 者 仅仅 使 用 的 资源 更 少 。 从 这 个 角度 
看 ， 上 面 两 个 函数 看 起 来 很 相似 。 它 们 都 使 用 基本 相同 的 算法 来 解决 求 和 问题 。 


在 这 点 上 ， 重 要 的 是 要 更 多 地 考虑 我 们 引 正 意义 上 的 计算 资源 。 有 两 种 方法 ， 一 种 是 考虑 算 
法 解决 问题 所 需 的 空间 或 者 内 存 。 解 决 方案 所 需 的 空间 通常 由 问题 本 身 决 定 。 但 是 ， 有 时 候 
有 的 算法 会 有 一 些 特殊 的 空间 需求 ， 这 种 情况 下 我 们 需要 非常 仔细 地 解释 这 些 变动 。 


作为 空间 需求 的 一 种 替代 方法 ， 我 们 可 以 基于 算法 执行 所 需 的 时 间 来 分 析 和 比较 算法 。 这 种 
测量 方式 有 时 被 称 为 算法 的 “执行 时 间 ? 或 “运行 时 间 ?。 我 们 可 以 通过 基准 分 析 ( benchmark 
analysis ) 来 测量 函数 SumOfN 的 执行 时 间 。 这 意味 着 我 们 将 记录 程序 计算 出 结果 所 需 的 实 
际 时 间 。 在 Python 中 ， 我 们 可 以 通过 记录 相对 于 系统 的 开始 时 间 和 结束 时 间 来 对 函数 进行 基 
准 测试 。 在 time 模块 中 有 一 个 time 函数 ， 它 可 以 在 任意 被 调用 的 地 方 返回 系统 时 钟 的 当前 时 
间 (以 秒 为 单位 ) 。 通 过 在 开始 和 结束 的 时 候 分 别 调用 两 次 time 函数 ， 然 后 计算 差异 ， 就 可 
以 得 到 一 个 函数 执行 花费 的 精确 秒 数 (大 多 数 情况 下 是 这 样 ) 。 


Listing 1 


import time 


def sumOfN2(n): 
start = time.time() 


theSum = 0 
for i in range(1,n+1): 
theSum = theSum + i 


end = time. time() 


return theSum, end-start 
WAR ed 个 包含 了 执行 结果 和 执行 消耗 时 间 的 元 组 


>» 

= 
( tuple ) 。 如 果 我 们 执行 这 个 函数 5 次 ， 每 次 计算 前 10,000 个 整数 的 和 ， 将 得 到 如 下 结 
果 : 


>>>for i in range(5): 

print("Sum is %d required %10.7f seconds"%sumOfN( 10000) ) 
Sum is 50005000 required 0©.0018950 seconds 
Sum is 50005000 required 0.0018620 seconds 
Sum is 50005000 required 0©.0019171 seconds 
Sum is 50005000 required 0.0019162 seconds 
Sum is 50005000 required 0©.0019360 seconds 
我 们 发 现时 间 是 相当 一 致 的 ， 执 行 这 段 代码 平均 需要 0.0019 秒 。 如 果 我 们 运行 计算 前 
100,000 个 整数 的 和 的 函数 呢 ? 


>>>for i in range(5): 
print("Sum is %d required %10.7f seconds"%sumOfN( 100000) ) 

Sum is 5000050000 required 0.0199420 seconds 

Sum is 5000050000 required .0180972 seconds 

Sum is 5000050000 required .0194821 seconds 

Sum is 5000050000 required .0178988 seconds 

Sum is 5000050000 required .0188949 seconds 

>>> 
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再 次 的 ， 尽 管 时 间 更 长 ， 但 每 次 运行 所 需 的 时 间 也 是 非常 一 致 的 ， 平 均 大约 多 10 倍 。 对 于 n 
等 于 1,000,000， 我 们 得 到 : 


>>>for i in range(5): 
print("Sum is %d required %10.7f seconds"%sumOfN( 1000000) ) 

Sum is 500000500000 required 0.1948988 seconds 

Sum is 500000500000 required .1850290 seconds 

Sum is 500000500000 required .1809771 seconds 

Sum is 500000500000 required .1729250 seconds 

Sum is 500000500000 required .1646299 seconds 

>>> 
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在 这 种 情况 下 ， 平 均值 也 大 约 是 前 一 次 的 10 倍 。 现 在 考虑 ActiveCode 3， 它 显示 了 求解 求 和 
问题 的 不 同方 法 。 函 数 sumOfN3 利用 封闭 方程 而 不 是 迭代 来 计算 前 n 个 整数 的 和 © 
pj = (n)(n+1) 
inl * ~~ 7 
ActiveCode 3 


def sumOfN3(n): 
return (n*(n+1))/2 


print (sumOfN3(10)) 


如 果 我 们 对 SUmOHN3 做 同样 的 基准 测试 ， 使 用 5 个 不 同 的 mn (10,000, 100,000, 1,000,000, 
10,000,000 和 100,000,000) ,我 们 得 到 如 下 结果 


Sum is 50005000 required 0.00000095 seconds 

Sum is 5000050000 required 0.00000191 seconds 

Sum is 500000500000 required 0.00000095 seconds 
Sum is 50000005000000 required 0.00000095 seconds 
Sum is 5000000050000000 required 0.00000119 seconds 


在 这 个 输出 中 有 两 件 事 需要 重点 关注 ， 首 先 上 面 记 录 的 执行 时 间 比 之 前 任何 例子 都 短 ， 另 外 
他 们 的 执行 时 间 和 mn 无 关 ， 看 起 来 SUmOHN3 LET Z n 的 影响 。 


但 是 这 个 基准 测试 能 告诉 我 们 什么 ?我们 可 以 很 直观 地 看 到 使 用 了 和 迭代 的 解决 方案 需要 做 更 
多 的 工作 ， 因 为 一 些 程序 步骤 被 重复 执行 。 这 可 能 是 它 需要 更 长 时 间 的 原因 。 此 外 ， 和 迭代 方 
案 执 行 所 需 时 间 随 着 门 递 增 。 另 外 还 有 个 问题 ， 如 果 我 们 在 不 同 计算 机 上 或 者 使 用 不 用 的 编 
程 语言 运行 这 个 函数 ， 我 们 也 可 能 得 到 不 同 的 结果 。 如 果 使 用 老 昌 的 计算 机 ， 可 能 需要 更 长 
时 间 才 能 执行 完 SUMOFNS © 


我 们 需要 一 个 更 好 的 方法 来 描述 这 些 算法 的 执行 时 间 。 基 准 测试 计算 的 是 程序 执行 的 实际 时 
间 。 它 并 不 丨 正 地 提供 给 我 们 一 个 有 用 的 度量 ( measurement ) ， 因 为 它 取 决 于 特定 的 机 器 ， 
程序 ， 时 间 ， 编 译 器 和 编程 语言 。 相 反 ， 我 们 希望 有 一 个 独立 于 所 使 用 的 程序 或 计算 机 的 度 
量 。 这 个 度量 将 有 助 于 独立 地 判断 算法 ， 并 且 可 以 用 于 比较 不 同 实现 方法 的 算法 的 效率 。 


2.3. 大 O 符 号 


当 我 们 试图 通过 执行 时 间 来 表征 算法 的 效率 时 ， 并 且 独 立 于 任何 特定 程序 或 计算 机 ， 重 要 的 
是 量化 算法 需要 的 操作 或 者 步骤 的 数量 。 选 择 适 当 的 基本 计算 单位 是 个 复杂 的 问题 ， 并 且 将 
取决 于 如 何 实现 算法 。 对 于 先前 的 求 和 算法 ， 一 个 比较 好 的 基本 计算 单位 是 对 执行 语句 进行 
计数 。 在 sumOfN 中 ， 赋 值 语句 的 计数 为 1 (thesum = 0) 加 上 nm 的 值 (我 们 执行 
theSum=theSum+i 的 次 数 ) 。 我 们 通过 函数 下 表示 T(n)=1 +n 。 参 数 n 通常 称 为 “问题 的 规 
模 '， 我 们 称 作 T(n) 是 解决 问题 大 小 为 n 所 花费 的 时 间 ， 即 1+n 步 长 。 在 上 面 的 求 和 元 数 

中 ， 使 用 nm 来 表示 问题 大 小 是 有 意义 的 。 我 们 可 以 说 ，100,000 个 整数 和 比 1000 个 问题 规模 
大 。 因 此 ， 所 需 时 间 也 更 长 。 我 们 的 目标 是 表示 出 算法 的 执行 时 间 是 如 何 相 对 问题 规模 大 小 
而 改变 的 。 


计算 机 科学 家 更 喜欢 将 这 种 分 析 技 术 进 一 步 扩 展 。 事 实证 明 ， 操 作 步 骤 数 量 不 如 确定 T(n) 最 
主要 的 部 分 来 的 重要 。 换 名 话说 ， 当 问题 规模 变 大 时 ，T(n) 函数 某 些 部 分 的 分 量 会 超过 其 他 
部 分 。 函 数 的 数量 级 表示 了 随 着 n 的 值 增加 而 增加 最 快 的 那些 部 分 。 数 量 级 通常 称 为 大 O 符 
号 ， 写 为 o(f(n)) 。 它 表示 对 计算 中 的 实际 步 数 的 近似 。 函 数 ftn) 提供 了 T(n) 最 主要 部 分 的 
表示 方法 。 


在 上 述 示 例 中 ，Tn)=1tn 。 当 mn 变 大 时 ， 常 数 1 对 于 最 终结 果 变 得 越 来 越 不 重要 。 如 果 我 们 
找 的 是 T(n) 的 近似 值 ， 我 们 可 以 删除 1， 运行 时 间 是 O(n)。 要 注意 ，1 对 于 T(n) 肯定 是 重 
要 的 。 但 是 当 n 变 大 时 ， 如 果 没 有 它 ， 我 们 的 近似 也 是 准确 的 。 


另外 一 个 示例 ， 假 设 对 于 一 些 算 法 ， 确 定 的 步 数 是 TUn)=5nA2 +27n+1005 ° 4 n 很 小 时 , 例如 
1 或 2， 常 数 1005 似乎 是 函数 的 主要 部 分 。 然 而 ， 随 着 n 变 大 ，n^2 这 项 变 得 越 来 越 重 要 。 
事实 上 ， 当 mn 费 的 很 大 时 ， 其 他 两 项 在 它们 确定 最 终结 果 中 所 起 的 作用 变 得 不 重要 。 当 n 变 
大 时 ， 为 了 近似 T(n)， 我 们 可 以 忽略 其 他 项 ， 只 关注 5nA2 。 系 数 5 也 变 得 不 重要 。 我 们 说 ， 
T(n) 具有 的 数量 级 为 f(n)=n^2。 或 者 O(n^2)。 


虽然 我 们 没有 在 求 和 示例 中 看 到 这 一 点 ， 但 有 时 算法 的 性 能 取决 于 数据 的 确切 值 ， 而 不 是 问 
题 规 模 的 大 小 。 对 于 这 种 类 型 的 算法 ， 我 们 需要 根据 最 佳 情况 ， 最 坏 情 况 或 平均 情况 来 表征 
它们 的 性 能 。 最 坏 情况 是 指 算法 性 能 特别 差 的 特定 数据 集 。 而 相同 的 算法 不 同 数据 集 可 能 具 
有 非常 好 的 性 能 。 大 多 数 情 况 下 ， 算 法 执行 效率 处 在 两 个 极端 之 间 (平均 情况 ) 。 对 于 计算 
机 科学 家 而 言 ， 重 要 的 是 了 解 这 些 区 别 ， 使 它们 不 被 某 一 个 特定 的 情况 误导 。 


当 你 学 习 算 法 时 ， 一 些 常见 的 数量 级 函数 将 会 反复 出 现 。 见 Table 1。 为 了 确定 这 些 函 数 中 哪 
个 是 最 主要 的 部 分 ， 我 们 需要 看 到 当 n 变 大 的 时 候 它 们 如 何 相互 比较 。 


f(n) Name 


\(1\) Constant 
\(\log n\) Logarithmic 
\(n\) Linear 
\(n\log n\) Log Linear 
\(n“{2}\) Quadratic 
\(n“{3}\) Cubic 
\(24{n}\) Exponential 
Table 1 


Figure 1 表示 了 Table 1 PH BRA ZB? SNR) > HA MIA] KARA CL o ika 
判断 哪个 是 主导 的 。 随 着 n 的 增长 ， 就 有 一 个 很 明确 的 关系 ， 很 容易 看 出 它们 之 间 的 大 小 关 
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Figure 1 
最 后 一 个 例子 ， 假 设 我 们 有 Listing2 的 代码 段 。 虽 然 这 个 程序 没有 做 任何 事 ， 但 是 对 我 们 获 
取 实 际 的 代码 和 性 能 分 析 是 有 益 的 。 


a=5 
b=6 
c=10 
for i in range(n): 
for j in range(n): 
x=i*i 
ye a ad 
ZAA 
for k in range(n): 
w = a*k + 45 
v = b*b 


Listing 2 


分 配 操作 数 分 为 四 个 项 的 总 和 。 第 一 个 项 是 常数 3, 表示 片段 开始 的 三 个 赋值 语 名。 第 二 项 是 
3n^2, 因为 由 于 吝 套 近代， 有 三 个 语句 执行 n^2 次 。 第 三 项 是 2n, 两 个 语句 近代 nn 次 。 最 后 ， 
第 四 项 是 常数 1， 表 示 最 终 赋值 语句 。 最 后 得 出 T(n)=3+3nA2 +2n+1=3n^2 + 2n+4， 通 过 查 
看 指数 ， 我 们 可 以 看 到 nA2 项 是 显 性 的 ， 因 此 这 个 代码 段 是 O(n^2 )。 当 mn 增 大 时 ， 所 有 其 
他 项 以 及 主 项 上 的 系数 都 可 以 忽略 。 
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Figure 2 


Figure 2 展示 了 一 些 常 用 的 KO 函数 ， 跟 上 面 讨论 的 T(n) 函数 比较 ， 一 开始 的 时 候 ，T(n) 大 
于 三 次 函数 ， 后 来 随 着 n 的 增长 ， 三 次 函数 超过 了 T(n)。T(n) 随 着 二 次 函数 继续 增长 。 


2.3. 大 O 


k a 


符号 
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2.4. 一 个 乱 序 字符 串 检 查 的 例子 


显示 不 同 量 级 的 算法 的 一 个 很 好 的 例子 是 字符 串 的 乱 序 检查 。 乱 序 字符 串 是 指 一 个 字符 事 只 
是 另 一 个 字符 串 的 重新 排列 。 例 如 ，'heart' 和 'earth' 就 是 乱 序 字符 串 。'python' 和 'typhon' 也 
是 。 为 了 简单 起 见 ， 我 们 假设 所 讨论 的 两 个 字符 串 具 有 相等 的 长 度 ， 并 且 他 们 由 26 个 小 写字 
母 集合 组 成 。 我 们 的 目标 是 写 一 个 布尔 隐 数 ， 它 将 两 个 字符 串 做 参数 并 返回 它们 是 不 是 乱 

序 。 


2.4.1. 解 法 1: 检 查 


我 们 对 乱 序 问题 的 第 一 个 解法 是 检查 第 一 个 字符 串 是 不 是 出 现在 第 二 个 字符 囊 中 。 如 果 可 以 
检验 到 每 一 个 字符 ， 那 这 两 个 字符 囊 一 定 是 乱 序 。 可 以 通过 用 None 替换 字符 来 了 解 一 个 字 
符 是 否 完成 检查 。 但 是 ， 由 于 Python 字符 串 是 不 可 变 的 ， 所 以 第 一 步 是 将 第 二 个 字符 串 转 换 
为 列表 。 检 查 第 一 个 字符 串 中 的 每 个 字符 是 否 存在 于 第 二 个 列表 中 ， 如 果 存 在 ， 替 换 成 
None。 见 ActiveCode1 


def anagramSolution1(s1,s2): 
alist = list(s2) 


posi = 0 
stillOK = True 


while pos1 < len(s1) and stillok: 
pos2 = 0 
found = False 
while pos2 < len(alist) and not found: 
if si[posi] == alist[pos2]: 
found = True 
else: 
pos2 = pos2 + 1 


if found: 

alist[pos2] = None 
else: 

stillOK = False 
posi = posi + 1 


return stillOK 


print (anagramSolution1('abcd', 'dcba')) 


ActiveCode1 


为 了 分 析 这 个 前 法， 我 们 注意 到 s1 的 每 个 字符 都 会 在 s2 中 进行 最 多 n 个 字符 的 迭代 。s2 列 
表 中 的 n 个 位 置 将 被 访问 一 次 来 匹配 来 自 S1 的 字符 。 访 问 次 数 可 以 写成 1 到 mn 整数 的 和 ， 


we n(n + 1) 
i=l 7 < 
可 以 写成 


Sn 变 大 ，nA^2 这 项 占据 主导 ，1/2 可 以 忽略 。 所 以 这 个 算法 复杂 度 为 O(n^2 ) 。 


2.4.2. 解 法 2: 排 序 和 比较 


另 一 个 解决 方案 是 利用 这 么 一 个 事实 : 即使 S1,s2 不 同 ， 它 们 都 是 由 完全 相同 的 字符 组 成 
的 。 所 以 ， 我 们 按照 字母 顺序 从 a 到 z 排列 每 个 字符 串 ， 如 果 两 个 字符 串 相 同 ， 那 这 两 个 字 
符 串 就 是 乱 序 字符 串 。 见 ActiveCode2 。 


def anagramSolution2(s1,s2): 
alist1 = list(s1) 
alist2 = list(s2) 


alist1.sort() 
alist2.sort() 


pos = 0 
matches = True 


while pos < len(s1) and matches: 
if alisti[pos]==alist2[pos]: 
pos = pos + 1 
else: 
matches = False 


return matches 


print (anagramSolution2('abcde', 'edcba')) 


ActiveCode2 


首先 你 可 能 认为 这 个 算法 是 O(n)， 因 为 只 有 一 个 简单 的 迭代 来 比较 排序 后 的 n 个 字符 。 但 
是 ， 调 用 Python 排序 不 是 没有 成 本 。 正 如 我 们 将 在 后 面 的 章节 中 看 到 的 ， 排 序 通常 是 
O(n^2) 或 O(nlogn)。 所 以 排序 操作 比 迭代 花费 更 多 。 最 后 该 算法 跟 排序 过 程 有 同样 的 量 级 。 


2.4.3. 解 法 3: 穷 举 法 


解决 这 类 问题 的 强力 方法 是 穷 举 所 有 可 能 性 。 对 于 乱 序 检测 ， 我 们 可 以 生成 s1 OARS 
符 串 列表 ， 然 后 查看 是 不 是 有 S2。 这 种 方法 有 一 点 困难 。 当 s1 生成 所 有 可 能 的 字符 串 时 ， 
第 一 个 位 置 有 n 种 可 能 ， 第 二 个 位 置 有 n-1 种 ， 第 三 个 位 置 有 n-3 种 ， 等 等 。 总 数 为 n(n 
-1) 米 (n-2) 米 .… 米 3 米 2 米 1n 米 (n-1) 米 (n-2) 米 .… 米 3 洲 2 米 1， 即 n!。 虽然 一 些 字符 串 可 能 是 重复 
的 ， 程 序 也 不 可 能 提前 知道 这 样 ， 所 以 他 仍然 会 生成 n! 个 字符 串 。 


事实 证 明 ，nl 比 n^2 增长 还 快 ， 事 实 上 ， 如 果 s1 有 20 个 字符 长 ， 则 将 有 201 = 
2,432,902,008,176,640,000 个 字符 串 产生 。 如 果 我 们 每 秒 处 理 一 种 可 能 字符 串 ， 那 么 需要 
77,146,816,596 年 才能 过 完整 个 列表 。 所 以 这 不 是 很 好 的 解决 方案 。 


2.4.4. 解 法 4: 计数 和 比较 


我 们 最 终 的 解决 方法 是 利用 两 个 乱 序 字符 串 具 有 相同 数目 的 a, b,c 等 字符 的 事实 。 我 们 首先 
计算 的 是 每 个 字母 出 现 的 次 数 。 由 于 有 26 个 可 能 的 字符 ， 我 们 就 用 一 个 长 度 为 26 的 列表 ， 
每 个 可 能 的 字符 占 一 个 位 置 。 每 次 看 到 一 个 特定 的 字符 ， 就 增加 该 位 置 的 计数 器 。 最 后 如 果 
两 个 列表 的 计数 器 一 样 ， 则 字符 串 为 乱 序 字符 串 。 见 ActiveCode 3 


def anagramSolution4(s1,s2): 
cl = [0]*26 
c2 = [0]*26 


for i in range(len(s1)): 
pos = ord(si[i])-ord(‘a') 
ci[pos] = ci[pos] + 1 


for i in range(len(s2)): 
pos = ord(s2[i])-ord(‘a') 
c2[pos] = c2[pos] + 1 


j=0 
stillOK = True 
while j<26 and stillOK: 
if ci[j]==c2[j]: 
j= jt 
else: 
stillOK = False 


return stillOK 


print (anagramSolution4('apple', 'pleap')) 


ActiveCode 3 


AŽ > AAF RASNA > (Fe R—-PMRER-H CREAN o AARRE n, 第 
三 个 迭代 ， 比 较 两 个 计数 列表 ， 需 要 26 步 ， 因 为 有 26 个 字母 。 一 共 
T(n)=2n+26T(n)=2n+26， 即 O(n)， 我 们 找到 了 一 个 线性 量 级 的 算法 解决 这 个 问题 。 


晶 它 需 


在 结束 这 个 例子 之 前 ， 我 们 来 讨论 下 空间 花费 ， 虽 然 最 后 一 个 方案 在 线性 时 间 执行 ， 但 
要 额外 的 存储 来 保存 两 个 字符 计数 列表 。 换 句 话说 ， 该 算法 牺牲 了 空间 以 获得 时 间 。 
很 多 情况 下 ， 你 需要 在 空间 和 时 间 之 间 做 出 权衡 。 这 种 情况 下 ， 额 外 空间 不 重要 ， 但 是 如 果 
有 数 百 万 个 字符 ， 就 需要 关注 下 。 作 为 一 个 计算 机 科学 家 ， 当 给 定 一 个 特定 的 算法 ， 将 由 你 
决定 如 何 使 用 计算 资源 。 


2.5.Python 数 据 结构 的 性 能 


现在 你 对 大 O 算法 和 不 同 函 数 之 间 的 差异 有 了 了 解 。 本 节 的 目标 是 告诉 你 Python 列表 和 字 
典 操 作 的 KO 性 能 。 然 后 我 们 将 做 一 些 基 于 时 间 的 实验 来 说 明 每 个 数据 结构 的 花 销 和 使 用 这 
些 数据 结构 的 好 处 。 重 要 的 是 了 解 这 些 数据 结构 的 效率 ， 因 为 它们 是 本 书 实 现 其 他 数据 结构 
所 用 到 的 基础 模块 。 本 节 中 ， 我 们 将 不 会 说 明 为 什么 是 这 个 性 能 。 在 后 面 的 章节 中 ， 你 将 看 
到 列表 和 字典 一 些 可 能 的 实现 ， 以 及 性 能 是 如 何 取决 于 实现 的 。 


2.6. 列 表 


python 的 设计 者 在 实现 列表 数据 结构 的 时 候 有 很 多 选择 。 每 一 个 这 种 选择 都 可 能 影响 列表 操 
作 的 性 能 。 为 了 帮助 他 们 做 出 正确 的 选择 ， 他 们 查看 了 最 常 使 用 列表 数据 结构 的 方式 ， 并 且 
优化 了 实现 ， 以 便 使 得 最 常见 的 操作 非常 快 。 当 然 ， 他 们 还 试图 使 较 不 常见 的 操作 快速 ， 但 
是 当 需 要 做 出 折 识 时 ， 较 不 常见 的 操作 的 性 能 通常 牺牲 以 支持 更 常见 的 操作 。 


两 个 常见 的 操作 是 索引 和 分 配 到 索引 位 置 。 无 论 列表 有 多 大 ， 这 两 个 操作 都 需要 相同 的 时 
间 。 当 这 样 的 操作 和 列表 的 大 小 无 关 时 ， 它 们 是 O (1) © 


另 一 个 非常 常见 的 编程 任务 是 增加 一 个 列表 。 有 两 种 方法 可 以 创建 更 长 的 列表 ， 可 以 使 用 
append 方法 或 拼接 运算 符 。append 方法 是 O (1)。 然而 ， 拼 接 运算 符 是 O (k) > HP k 
是 要 拼接 的 列表 的 大 小 。 这 对 你 来 说 很 重要 ， 因 为 它 可 以 帮助 你 通过 选择 合适 的 工具 来 提高 


你 自己 的 程序 的 效率 。 


让 我 们 看 看 四 种 不 同 的 方式 ， 我 们 可 以 生成 一 个 从 0 开始 的 n 个 数字 的 列表 。 首 先 ， 我 们 将 党 
试 一 个 for 循环 并 通过 创建 列表 ， 然 后 我 们 将 使 用 append 而 不 是 拼接 。 接 下 来 ， 我 们 使 用 列 
表 生 成 器 创建 列表 ， 最 后 ， 也 是 最 明显 的 方式 ， 通 过 调用 列表 构造 函数 包装 range 函数 。 


def test1(): 


1= [] 
for i in range(1000): 
1=1+ [i] 


def test2(): 


1= [] 
for i in range(1000): 
l.append(i) 


def test3(): 
l = [i for i in range(1000) ] 


def test4(): 
1 = list(range(1000) ) 


要 捕获 我 们 的 每 个 函数 执行 所 需 的 时 间 ， 我 们 将 使 用 Python 的 timeit 模块 。timeit 模块 旨 在 
允许 Python 开发 人 员 通 过 在 一 致 的 环境 中 运行 防 数 并 使 用 尽 可 能 相似 的 操作 系统 的 时 序 机 制 
来 进行 跨 平台 时 序 测量 。 


要 使 用 timeit， 你 需要 创建 一 个 Timer 对 象 ， 其 参数 是 两 个 Python 语句 。 第 一 个 参数 是 一 个 
你 想 要 执行 时 间 的 Python 语句 ; 第 二 个 参数 是 一 个 将 运行 一 次 以 设置 测试 的 语句 。 然 后 timeit 
模块 将 计算 执行 语句 所 需 的 时 间 。 默 认 情 况 下 ，timeit 将 尝试 运行 语句 一 百 万 次 。 SEHK 


时 ， 它 返回 时 间作 为 表示 总 秒 数 的 浮 点 值 。 由 于 它 执 行 语 如 一 百 万 次 ， 可 以 读 取 结 果 作 为 执 
行 测试 一 次 的 微 秒 数 。 你 还 可 以 传递 timeit 一 个 参数 名 字 为 number， 允 许 你 指定 执行 测试 语 
句 的 次 数 。 以 下 显示 了 运行 我 们 的 每 个 测试 功能 1000 次 需要 多 长 时 间 。 


t1 = Timer("test1()", "from _main__ import test1") 
print("concat ",t1.timeit(number=1000), "milliseconds" ) 

t2 = Timer("test2()", "from _main__ import test2") 
print("append ",t2.timeit(number=1000), "milliseconds" ) 

t3 = Timer("test3()", "from _main__ import test3") 
print("comprehension ",t3.timeit(number=1000), "milliseconds" ) 
t4 = Timer("test4()", "from _main__ import test4") 
print("list range ",t4.timeit(number=1000), "milliseconds" ) 


concat 6.54352807999 milliseconds 

append 0.306292057037 milliseconds 
comprehension 0.147661924362 milliseconds 
list range 0.0655000209808 milliseconds 


在 上 面 的 例子 中 ， 我 们 对 test1(), test2() 等 的 函数 调用 计时 ，Ssetup 语句 可 能 看 起 来 很 奇怪 ， 
所 以 我 们 详细 说 明 下 。 你 可 能 非常 熟悉 from import 语句 ， 但 这 通常 用 在 python 程序 文件 的 
开头 。 在 这 种 情况 下 ， from _main__ import testı JA _main 命名 空间 导入 到 timeit 设置 
的 命名 空间 中 。timeit 这 么 做 是 因为 它 想 在 一 个 干净 的 环境 中 做 测试 ， 而 不 会 因为 可 能 有 你 创 
建 的 任何 杂 变 量 ， 以 一 种 不 可 预见 的 方式 干扰 你 函数 的 性 能 。 


从 上 面 的 试验 清楚 的 看 出 ，append 操作 比拼 接 快 得 多 。 其 他 两 种 方法 ， 列 表 生 成 器 的 速度 是 
append 的 两 倍 。 


最 后 一 点 ， 你 上 面 看 到 的 时 间 都 是 包括 实际 调用 函数 的 一 些 开 销 ， 但 我 们 可 以 假设 函数 调用 
开销 在 四 种 情况 下 是 相同 的 ， 所 以 我 们 仍然 得 到 的 是 有 意义 的 比较 。 因 此 ， 拼 接 字符 串 操 作 
需要 6.54 毫秒 并 不 准确 ， 而 是 拼接 字符 串 这 个 函数 需要 6.54 毫秒 。 你 可 以 测试 调用 空 函 数 
所 需要 的 时 间 ， 并 从 上 面 的 数字 中 减 去 它 。 


现在 我 们 已 经 看 到 了 如 何 具 体 测试 性 能 ， 见 Table2, 你 可 能 想 知 道 pop 两 个 不 同 的 时 间 。 当 
列表 末尾 调用 pop 时 ， 它 需要 O(1), 但 是 当 在 列表 中 第 一 个 元 素 或 者 中 间 任 何 地 方 调用 pop, 
Ex O(n)。 原 因 在 于 Python 实现 列表 的 方式 ， 当 一 个 项 从 列表 前 面 取出 ， 列 表 中 的 其 他 元 
素 靠 近 起 始 位 置 移动 一 个 位 置 。 你 会 看 到 索引 操作 为 O(1)。python 的 实现 者 会 权衡 选择 一 个 
好 的 方案 。 


Operation Big-O Efficiency 


index [] O(1) 
index assignment O(1) 
append O(1) 
pop() O(1) 
pop() O(n) 
insert(i,item) O(n) 
del operator O(n) 
iteration O(n) 
contains (in) O(n) 
get slice [x:y] Ofk) 
del slice O(n) 
set slice O(n+k) 
reverse O(n) 
concatenate O(k) 
sort O(n log n) 
multiply O(nk) 


作为 一 种 演示 性 能 差异 的 方法 ， 我 们 用 timeit 来 做 一 个 实验 。 我 们 的 目标 是 验证 从 列表 从 末 
尾 pop 元 素 和 从 开始 pop 元 素 的 性 能 。 同 样 ， 我 们 也 想 测 量 不 同 列表 大 小 对 这 个 时 间 的 影 
响 。 我 们 期 望 看 到 的 是 ， 从 列表 末尾 处 弹出 所 需 时 间 将 保持 不 变 ， 即 使 列表 不 断 增长 。 而 从 
列表 开始 处 弹出 元 素 时 间 将 随 列 表 增 长 而 增加 。 


Listing 4 展示 了 两 种 pop 方式 的 比较 。 从 第 一 个 示例 看 出 ， 从 末尾 弹出 需要 0.0003 毫秒 。 从 
开始 弹出 要 花费 4.82 毫秒 。 对 于 一 个 200 万 的 元 素 列表 ， 相 差 16000 倍 。 


Listing 4 需要 注意 的 几 点 ， 第 一 ， from _main import x ,虽然 我 们 没有 定义 一 个 函数 ， 我 
们 确实 希望 能 够 在 我 们 的 测试 中 使 用 列表 对 象 x, 这 种 方法 允许 我 们 只 计算 单个 弹出 语句 ， 获 

得 该 操作 最 精确 的 测量 时 间 。 因 为 timer 重复 了 1000 次 ， 该 列表 每 次 循环 大 小 都 减 1。 但 是 

由 于 初始 列表 大 小 为 200 万 ， 我 们 只 减少 总 体 大 小 的 0.05%。 


popzero = timeit.Timer("x.pop(0)", 
"from __main__ import x") 
popend = timeit.Timer("x.pop()", 
"from _main_ import x") 


x = list(range(2000000) ) 
popzero. timeit (number=1000 ) 
4.8213560581207275 


x = list(range(2000000) ) 
popend. timeit (number=1000 ) 
0.0003161430358886719 


Listing 4 


虽然 我 们 第 一 个 测试 显示 pop(0) 比 pop() 慢 ， 但 它 没 有 证 明 pop(0) Æ O(n), pop) Æ O(1) ° 
要 验证 它 ， 我 们 需要 看 下 一 系列 列表 大 小 的 调用 效果 。 


popzero = Timer("x.pop(0)", 
"from __main__ import x") 
popend = Timer("x.pop()", 
"from __main__ import x") 
print("pop(®)  pop()") 
for i in range(1000000, 100000001, 1000000) : 
x = list(range(i)) 
pt = popend.timeit(number=1000) 
x = list(range(i)) 
pz = popzero.timeit (number=1000 ) 
print("%15.5f, %15.5f" %(pz,pt)) 


Listing 5 


Figure 3 展示 了 我 们 实验 的 结果 ， 你 可 以 看 到 ， 随 着 列表 变 长 ，pop(0) 时 间 也 增加 ， 而 pop() 
时 间 保 持 非 常平 坦 。 这 正 是 我 们 期 望 看 到 的 O(n) 和 O(1) 


Time (Secs) To Execute pop Statement 


200 


150 


100 


50 


@ pop(0) 


A pop() 


20,000,000 


40,000,000 


List Size 





60,000,000 


90,000,000 
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2.7.7 #% 


python 中 第 二 个 主要 的 数据 结构 是 字典 。 你 可 能 记得 ， 字 典 和 列表 不 同 ， 你 可 以 通过 键 而 不 
是 位 置 来 访问 字典 中 的 项 目 。 在 本 书 的 后 面 ， 你 会 看 到 有 很 多 方法 来 实现 字典 。 字 典 的 get 
和 set 操作 都 是 DO(1)。 另 一 个 重要 的 操作 是 contains， 检 查 一 个 键 是 否 在 字典 中 也 是 O(1)。 
所 有 字典 操作 的 效率 总 结 在 Table3 中 。 关 于 字典 性 能 的 一 个 重要 方面 是 ， 我 们 在 表 中 提供 的 
效率 是 针对 平均 性 能 。 在 一 些 罕见 的 情况 下 ，contains，get item 和 set item 操作 可 以 退化 为 
O(n) 。 我 们 将 在 后 面 的 章节 介绍 。 


operation Big-O Efficiency 
copy O(n) 
get item O(1) 
set item O(1) 
delete item O(1) 
contains (in) O(1) 
iteration O(n) 
Table 3 


我 们 会 在 最 后 的 实验 中 ， 将 比较 列表 和 字典 之 间 的 contains 操作 的 性 能 。 在 此 过 程 中 ， 我 们 
将 确认 列表 的 contains 操作 符 是 O(n)， 字 典 的 contains 操作 符 是 O(1)。 我 们 将 在 实验 中 列 
出 一 系列 数字 。 然 后 随机 选择 数字 ， 并 检查 数字 是 否 在 列表 中 。 如 果 我 们 的 性 能 表 是 正确 
的 ， 列 表 越 大 ， 确 定 列表 中 是 否 包含 任意 一 个 数字 应 该 花费 的 时 间 越 长 。 


Listing 6 实现 了 这 个 比较 。 注 意 ， 我 们 对 容器 中 的 数字 执行 完全 相同 的 操作 。 区 别 在 于 在 第 7 
行 上 X 是 一 个 列表 ， 第 9 行 上 的 x 是 一 个 字典 。 


import timeit 
import random 


for i in range(10000, 1000001, 20000): 

t = timeit.Timer("random.randrange(%d) in x"%i, 
"from __main__ import random, x") 

x = list(range(i)) 
lst_time = t.timeit(number=1000) 
x = {j:None for j in range(i)} 
d_time = t.timeit(number=1000) 
print("%d,%10.3f,%10.3f" % (i, lst_time, d_time)) 


Listing 6 


Figure 4 展示 了 Listing6 的 结果 。 你 可 以 看 到 字典 一 直 更 快 。 对 于 最 小 的 列表 大 小 为 10,000 
个 元 素 ， 字 典 是 列表 的 89.4 倍 。 对 于 最 大 的 列表 大 小 为 990,000 个 元 素 。 字 典 是 列表 的 11,603 
4% | 你 还 可 以 看 到 列表 上 的 contains 运 算 符 所 花费 的 时 间 与 列表 的 大 小 成 线性 增长 。 这 验证 了 
列表 上 的 contains 运 算 符 是 O(n) 的 断言 。 还 可 以 看 出 ， 字 典 中 的 contains 运算 符 的 时 间 是 恒 
定 的 ， 即 使 字典 大 小 不 断 增长 。 事 实 上 ， 对 于 字典 大 小 为 10,000 个 元 素 ，contains 操 作 占 用 
0.004 毫 秒 ， 对 于 字典 大 小 为 990,000 个 元 素 ， 它 也 占用 0.004 毫 秒 。 
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Time to Complete Contains Operation 





0 
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Size of List or Dictionary 
Figure 4 


由 于 Python 是 一 种 不 断 发 展 的 语言 ， 底 层 总 是 有 变化 的 。 有关 Python 数据 结构 性 能 的 最 新 
信息 可 以 在 Python 网 站 上 找到 。 在 撰写 本 文 时 ，Python wiki 有 一 个 很 好 的 时 间 复 杂 性 页 
面 ， 可 以 在 Time Complexity Wiki 中 找到 。 


© 算法 分 析 是 一 种 独立 的 测量 算法 的 方法 。 
e 大 O 表 示 法 允许 根据 问题 的 大 小 ， 通 过 其 主要 部 分 来 对 算法 进 


和 


分 


Fo 
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3.1. 目 标 


o 理解 抽象 数据 类 型 的 栈 ， 队 列 ，deque 和 列表 。 

o 能 够 使 用 Python 列表 实现 ADT 堆栈 ， 队 列 和 deque 。 

© 了 解 基本 线性 数据 结构 实现 的 性 能 。 

。 了 解 前 级， 中 缓和 后 组 表达 式 格式 。 

。 使 用 栈 来 实现 后 组 表达 式 。 

。 使 用 栈 将 表达 式 从 中 组 转换 为 后 缓 。 

。 使 用 队列 进行 基本 时 序 仿 上 由 。 

o 能 够 识别 问题 中 栈 ， 队 列 和 deques 数据 结构 的 适当 使 用 。 
© 能 够 使 用 节点 和 引用 将 抽象 数据 类 型 列表 实现 为 链表 。 

o 能 够 比较 我 们 的 链表 实现 与 Python 的 列表 实现 的 性 能 。 


3.2. 什 么 是 线性 数据 结构 


我 们 从 四 个 简单 但 重要 的 概念 开始 研究 数据 结构 。 栈 ， 队 列 ，deques, 列表 是 一 类 数据 的 容 
器 ， 它 们 数据 项 之 间 的 顺序 由 添加 或 删除 的 顺序 决定 。 一 旦 一 个 数据 项 被 添加 ， 它 相对 于 前 
后 元 素 一 直 保 持 该 位 置 不 变 。 诸 如 此 类 的 数据 结构 被 称 为 线性 数据 结构 。 


线性 数据 结构 有 两 端 ， 有 时 被 称 为 左右 ， 某 些 情况 被 称 为 前 后 。 你 也 可 以 称 为 顶部 和 底部 ， 
名 字 都 不 重要 。 将 两 个 线性 数据 纪 a. cae 特别 是 添加 和 移 
除 项 的 位 置 。 例 如 一 些 结 构 允许 从 一 端 添加 项 ， 另 一 些 允许 从 另 一 余 项 。 


些 变种 的 形式 产生 了 计 莫 机 科学 最 有 用 的 数据 结构 。 他 们 出 现在 各 种 算法 中 ， 并 可 以 用 于 
解决 很 多 重要 的 问题 。 


3.3. 什 么 是 栈 


R (有 时 称 为 “后 进 先 出 栈 ”) 是 一 个 项 的 有 序 集合 ， 其 中 添加 移 除 新 项 总 发 生 在 同一 端 。 这 一 
端 通常 称 为 “顶部 ”。 与 顶部 对 应 的 端 称 为 “底部 ”。 


栈 的 底部 很 重要 ， 因 为 在 栈 中 靠近 底部 的 项 是 存储 时 间 最 长 的 。 最 近 添 加 的 项 是 最 先 会 被 移 
除 的。 这 种 排序 原则 有 时 被 称 为 LIFO， 后 进 先 出 。 它 基于 在 集合 内 的 时 间 长 度 做 排序 。 较 新 
的 项 靠近 顶部 ， 较 旧 的 项 靠近 底部 。 


栈 的 例子 很 常见 。 几 乎 所 有 的 自助 餐厅 都 有 一 堆 托盘 或 盘子 ， 你 从 顶部 拿 一 个 ， 就 会 有 一 个 
新 的 托盘 给 下 一 个 客人 人。 想象 桌 上 有 一 堆 书 (Figure 1), 只 有 顶部 的 那 本 书 封面 可 见 ， 要 看 到 其 
他 书 的 封面 ， 只 有 先 移 除 他 们 上 面 的 书 。Figure 2 展示 了 另 一 个 栈 ， 包 含 了 很 多 Python 对 

Bo 





Figure 1 
Figure 2 
和 栈 相 关 的 最 有 用 的 想法 之 一 来 自 对 它 的 观察 。 假 设 从 一 个 干净 的 桌面 开始 ， 现 在 把 书 一 本 
本 司 起 来 ， 你 在 构造 一 个 栈 。 考 虑 下 移 除 一 本 书 会 发 生 什么 。 移 除 的 顺序 跟 刚 刚 被 放置 的 顺 


序 相 反 。 栈 之 所 以 重要 是 因为 它 能 反 转 项 的 顺序 。 插 入 跟 删 除 顺序 相反 ，Figure 3 展示 了 
Python 数据 对 象 创建 和 删除 的 过 程 ， 注 意 观察 他 们 的 顺序 。 





4th = 
3rd | 


8.4 True “dog” 4 “dog” True 8.4 
Original Order Reversed Order 


Figure 3 

想 想 这 种 反 转 的 属性 ， 你 可 以 想到 使 用 计算 机 的 时 候 所 碰 到 的 例子 。 例 如 ， 每 个 web 浏览 器 
都 有 一 个 返回 按钮 。 当 你 浏览 网 页 时 ， 这 些 网 页 被 放置 在 一 个 栈 中 (实际 是 网 页 的 网 址 ) © 
你 现在 查看 的 网 页 在 顶部 ， 你 第 一 个 查看 的 网 页 在 底部 。 如 果 按 返回" 按钮 ， 将 按 相 反 的 顺序 
浏览 刚才 的 页 面 。 
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3.4. 栈 的 抽象 数据 类 型 


栈 的 抽象 数据 类 型 由 以 下 结构 和 操作 定义 。 如 上 所 述 ， 栈 被 构造 为 项 的 有 序 集合 ， 其 中 项 被 
添加 和 从 末端 移 除 的 位 置 称 为 “顶部 ”。 栈 是 有 序 的 LIFO 。 栈 操作 如 下 。 


© Stack() 创建 一 个 空 的 新 栈 。 它 不 需要 参数 ， 并 返回 一 个 空 栈 。 

。 push(item) 将 一 个 新 项 添加 到 栈 的 顶部 。 它 需要 item 做 参数 并 不 返回 任何 内 容 。 
© pop() 从 栈 中 删除 顶部 项 。 它 不 需要 参数 并 返回 tem 。 栈 被 修改 。 

。 peek() 从 栈 返回 顶部 项 ， 但 不 会 删除 它 。 不 需要 参数 。 不 修改 栈 。 

。 isEmpty() 测试 栈 是 否 为 空 。 不 需要 参数 ， 并 返回 布尔 值 。 

e Size() 返回 栈 中 的 item 数量 。 不 需要 参数 ， 并 返回 一 个 整数 。 


例如 ，S 是 已 经 创建 的 空 栈 ，Table1 展示 了 栈 操作 序列 的 结果 。 栈 中 ， 顶 部 项 列 在 最 右边 。 


Stack Operation Stack Contents Return Value 
s.isEmpty() 口 True 
s.push(4) [4] 
s.push('dog') [4, 'dog"] 
s.peek() [4, 'dog"] "dog 
s.push(True) [4, 'dog' , True] 
s.size() [4, dog ' , True] 3 
s.isEmpty() [4, ‘dog’ , True] False 
s.push(8.4) [4, 'dog' ,True,8.4] 
s.pop() [4, dog ' , True] 8.4 
s.pop() [4, dog '] True 
s.size() [4, 'dog"] 2 


Table1 


3.5.Python 实 现 栈 


现在 我 们 已 经 将 栈 清 楚 地 定义 了 抽象 数据 类 型 ， 我 们 将 把 注意 力 转 向 使 用 Python 实现 栈 。 回 
想 一 下 ， 当 我 们 给 抽象 数据 类 型 一 个 物理 实现 时 ， 我 们 将 实现 称 为 数据 结构 。 


正如 我 们 在 第 1 章 中 所 描述 的 ， 在 Python 中 ， 与 任何 面向 对 象 编程 语言 一 样 ， 抽 象 数 据 类 型 
(如 栈 ) 的 选择 的 实现 是 创建 一 个 新 类 。 栈 操作 实现 为 类 的 方法 。 此 外 ， 为 了 实现 作为 元 素 
集合 的 栈 ， 使 用 由 Python 提供 的 原 语 集合 的 能 力 是 有 意义 的 。 我 们 将 使 用 列表 作为 底层 实 
现 。 


回想 一 下 ，Python 中 的 列表 类 提供 了 有 序 集合 机 制 和 一 组 方法 。 例 如 ， 如 果 我 们 有 列表 
[2,5,3,6,7,4] ， 我 们 只 需要 确定 列表 的 哪 一 端 将 被 认为 是 栈 的 顶部 。 一 旦 确定 ， 可 以 使 用 诸如 
append 和 pop 的 列表 方法 来 实现 操作 。 


以 下 栈 实现 (ActiveCode 1) 假定 列表 的 结尾 将 保存 栈 的 顶部 元 素 。 随 着 栈 增长 (push 操 
作 ) ， 新 项 将 被 添加 到 列表 的 末尾 。 pop 也 操作 列表 末尾 的 元 素 。 


class Stack: 
def _ init__(self): 
self.items = [] 


def isEmpty(self): 
return self.items == [] 


def push(self, item): 
self.items.append(item) 


def pop(self): 
return self.items.pop() 


def peek(self): 
return self.items[len(self.items) -1] 


def size(self): 
return len(self.items) 


ActiveCode 1 


记 住 我 们 只 定义 类 的 实现 ， 我 们 需要 创建 一 个 栈 ， 然 后 使 用 它 。ActiveCode 2 展示 了 我 们 通 
过 实例 化 Stack 类 执行 Table 1 中 的 操作 。 注 意 ，Stack 类 的 定义 是 从 pythonds 模块 导入 
的 。 


Note pythonds 模块 包含 本 书 中 讨论 的 所 有 数据 结构 的 实现 。 它 根据 以 下 部 分 构造 : 基 
本 数据 类 型 ， 树 和 图 。 该 模块 可 以 从 pythonworks.org 下 载 。 


from pythonds.basic.stack import Stack 


s=Stack() 


print(s.isEmpty()) 
s.push(4) 
s.push('dog') 
print(s.peek()) 
s.push(True) 
print(s.size()) 
print(s.isEmpty()) 
s.push(8.4) 
print(s.pop()) 
print(s.pop()) 
print(s.size()) 


ActiveCode 2 


Je 
3.6. 简 单 括 号 匹配 
我 们 现在 把 注意 力 转 向 使 用 栈 解决 中 正 的 计算 机 问题 。 你 会 这 人 么 写 算 术 表 达 式 


(5+6)*(7+8)/(4+3) 


其 中 括号 用 于 命令 操作 的 执行 。 你 可 能 也 有 一 些 语言 的 经 验 ， 如 Lisp 的 构造 


(defun square(n) 


(* n n)) 


XL 
号 是 臭名 昭著 的 。 
在 这 两 个 例子 中 ， 括 号 必须 以 匹配 的 方式 出 现 。 括 号 匹配 意味 着 每 个 开始 符号 具有 相应 的 结 
束 符号 ， 并 且 括 号 能 被 正确 诅 套 。 考 虑 下 面 正 确 匹 配 的 括号 字符 串 : 
(0000) 
(((()))) 
(()((())())) 
对 比 那 些 不 匹配 的 括号 : 


(((((((O)) 
())) 


(WOW 


区 分 括号 是 否 匹 配 的 能 力 是 识别 很 多 编程 语言 结构 的 重要 部 分 。 具 有 挑战 的 是 如 何 编写 一 个 
算法 ， 能 够 从 左 到 右 读 取 一 串 符号 ， 并 决定 符号 是 否 平衡 。 为 了 解决 这 个 问题 ， 我 们 需要 做 
一 个 重要 的 观察 。 从 左 到 右 处 理 符号 时 ， 最 近 开 始 符号 必须 与 下 一 个 关闭 符号 相 匹配 ( 见 

Figure 4)。 此 外 ， 处 理 的 第 一 个 开始 符号 必须 等 待 直到 其 匹配 最 后 一 个 符号 。 结 束 符 号 以 相 


反 的 顺序 匹配 开始 符号 。 他 们 从 内 到 外 匹配 。 这 是 一 个 可 以 用 栈 解决 问题 的 线索 。 


Most recent open matches first close 


a First open may wait until last close 


Figure 4 


一 旦 你 认为 栈 是 保存 括号 的 恰当 的 数据 结构 ， 算 法 是 很 直接 的 。 从 空 栈 开始 ， 从 左 到 右 处 理 
括号 字符 串 。 如 果 一 个 符号 是 一 个 开始 符号 ， 将 其 作为 一 个 信号 ， 对 应 的 结束 符号 稍 后 会 出 
现 。 另 一 方面 ， 如 果 符号 是 结束 符号 ， 弹 出 栈 ， 只 要 弹出 栈 的 开始 符号 可 以 匹配 每 个 结束 符 
号 ， 则 括号 保持 匹配 状态 。 如 果 任 何 时 候 栈 上 没有 出 现 符合 开始 符号 的 结束 符号 ， 则 字符 串 
不 匹配 。 最 后 ， 当 所 有 符号 都 被 处 理 后 ， 栈 应 该 是 空 的 。 实 现 此 算法 的 Python 代码 见 
ActiveCode 1 ° 


from pythonds.basic.stack import Stack 


def parChecker(symbolString): 
s = Stack() 
balanced = True 
index = 0 
while index < len(symbolString) and balanced: 
symbol = symbolString[index] 
if symbol == "(": 
s.push(symbol) 
else: 
if s.isEmpty(): 
balanced = False 
else: 


s.pop() 
index = index + 1 
if balanced and s.isEmpty(): 
return True 
else: 


return False 


print (parChecker('((()))')) 
print (parChecker('(()')) 
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3.7. 符 号 匹配 


上 面 显 示 的 匹配 括号 问题 是 许多 编程 语言 都 会 出 现 的 一 般 情 况 的 特定 情况 。 匹 配 和 误 套 不 同 
种 类 的 开始 和 结束 符号 的 情况 经 常 发 生 。 例 如 ， 在 Python 中 ， 方 括号 [ 和 ] 用 于 列表 ， 
花 括号 { 和 } 用 于 字典 。 括 号 ( 和 ) 用 于 元 祖 和 算术 表达 式 。 只 要 每 个 符号 都 能 保持 
自己 的 开始 和 结束 关系 ， 就 可 以 混合 符号 。 符 号 字符 串 如 

roan AGO alla Datel eel 

eee Gl 

[OC (0 
这 些 被 恰当 的 匹配 了 ， 因 为 不 仅 每 个 开始 符号 都 有 对 应 的 结束 符号 ， 而 且 符 号 的 类 型 也 匹 
配 。 


相反 这 些 字 符 串 没 法 匹配 : 


CED 
caw APs fd 


PECI 


上 节 的 简单 括号 检查 程序 可 以 轻松 的 扩展 处 理 这 些 新 类 型 的 符号 。 回 想 一 下 ， 每 个 开始 符号 
被 简单 的 压 入 栈 中 ， 等 待 匹 配 的 结束 符号 出 现 。 当 出 现 结 束 符号 时 ， 唯 一 的 区 别 是 我 们 必须 
检查 确保 它 正确 匹配 栈 顶 部 开始 符号 的 类 型 。 如 果 两 个 符号 不 匹配 ， 则 字符 串 不 匹配 。 如 果 


整个 字符 串 都 被 处 理 完 并 且 没有 什么 留 在 栈 中 ， 则 字符 串 匹配 。 


Python 程序 见 ActiveCode 1。 唯 一 的 变化 是 16 行 ， 我 们 称 之 为 辅助 函数 匹配 。 必 须 检 查 栈 
中 每 个 删除 的 符号 ， 以 查看 它 是 否 与 当前 结束 符号 匹配 。 如 果 不 匹 配 ， 则 布尔 变量 balanced 
被 设置 为 False ° 


from pythonds.basic.stack import Stack 


def parChecker(symbolString): 
s = Stack() 
balanced = True 
index = 0 
while index < len(symbolString) and balanced: 
symbol = symbolString[index] 
if symbol in "([{": 
s.push(symbol) 
else: 
if s.isEmpty(): 
balanced = False 
else: 
top = s.pop() 
if not matches(top, symbol): 
balanced = False 
index = index + 1 
if balanced and s.isEmpty(): 
return True 
else: 
return False 


def matches(open, close): 


opens = "([{" 
closers = ")]}" 
return opens.index(open) == closers.index(close) 


print(parChecker('{{(L][])}()}')) 
print (parChecker('[{()]')) 
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符号 必须 按照 平衡 匹配 的 顺序 。 栈 还 有 其 他 重要 的 用 途 ， 我 们 将 在 接 下 来 的 部 分 讨论 。 


3.8. 十 进 制 转换 成 二 进 


在 你 学 习 计 算 机 的 过 程 中 ， 你 可 能 已 经 接触 了 二 进 制 。 二 进 制 ERMA P ， 
因为 存储 在 计算 机 内 的 所 有 值 都 是 以 0 和 1 存储 的 。 如 果 没 有 能 力 在 二 进 制 数 和 普通 字符 串 
之 间 转 换 ， 我 们 与 计算 机 之 间 的 交互 非常 坏 手 。 

整数 值 是 常见 的 数据 项 。 他 们 一 直 用 于 计算 机 程序 和 计算 。 epee 习 它 们 ， 当 然 


最 后 用 十 进 制 或 者 基数 10 来 表示 它们 。 十 进 制 233^10 以 及 对 应 的 二 进 制 表示 11101001^2 
分 别 解释 为 


过 


2x 107+3x10!'+3x10° 


1x274+1x2°+1x2°+0x2*+1x2°>4+0x2?+0x2'4+1x2° 


但 是 我 们 如 何 能 够 容易 地 将 整数 值 转换 为 二 进 制 呢 ? 答案 是 “ 除 2" 算 法 ， 它 用 栈 来 跟踪 二 进 制 
结果 的 数字 。 


除 2” 算法 假定 我 们 从 大 于 0 的 整数 开始 。 不 断 迭 代 的 将 十 进 制 除 以 2， 并 跟踪 余数 。 第 一 个 
除 以 2 的 余数 说 明了 这 个 值 是 偶数 还 是 奇数 。 偶 数 有 0 的 余数 ， 记 为 0。 奇数 有 余数 1， 记 为 
1. 我 们 将 得 到 的 二 进 制 构建 为 数字 序列 ， 第 一 个 余数 实际 上 是 序列 中 的 最 后 一 个 数字 。 见 
Figure 5 , 我 们 再 次 看 到 了 反 转 的 属性 ， 表 示 栈 可 能 是 解决 这 个 问题 的 数据 结构 。 


233 //2=116 rem=1 
116 /2=58 rem=0 
58/2=29 rem=0 
2g//2=14 rem=1 
14/2=7 rem=0 
7H#2=3 rem=1 


3//2=1 rem=1 


push remainders 
ssapurewas dod 


1/2=0 rem=1 


Figure 5 
Activecode 1 中 的 Python 代码 实现 了 “ 除 2” HK > BHA divideBy2 传 入 了 一 个 十 进 制 的 参 


数 ， 并 重复 除 以 2。 第 7 da 模 运 算 符 % 来 提取 余数 ， 第 8 行将 余数 压 到 栈 上 。 当 
除 到 0 后 ，11-13 行 构 造 了 一 fil AF Bo 


from pythonds.basic.stack import Stack 


def divideBy2(decNumber): 
remstack = Stack() 


while decNumber > 0: 
rem = decNumber % 2 
remstack.push(rem) 
decNumber = decNumber // 2 
binString = "" 
while not remstack.isEmpty(): 
binString = binString + str(remstack.pop()) 


return binString 


print (divideBy2(42) ) 
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这 个 用 于 二 进 制 转换 的 算法 可 以 很 容易 的 扩展 以 执行 任何 基数 的 转换 。 在 计算 机 科学 中 ， 通 
常会 使 用 很 多 不 同 的 编码 。 其 中 最 常见 的 是 二 级 制 ， 八 进 制 和 十 六 进 制 。 


十 进 制 233 和 它 对 应 的 八进制 和 十 六 进 制 351^8, E9^16 


3x8? +5x8!' 41x88? 14x16! +9x 16? 


可 以 修改 divideBy2 函数 ， 使 它 不 仅 能 接受 十 进 制 参数 ， 还 能 接受 预期 转换 的 基数 。' 除 2' 的 
概念 被 简单 的 替换 成 更 通用 的 ' 除 基数 '。 在 ActiveCode2 展示 的 是 一 个 名 为 baseConverter 
函数 。 采 用 十 进 制 数 和 2 到 16 之 间 的 任何 基数 作为 参数 。 余 数 部 分 仍然 入 栈 ， 直 到 被 转换 的 
MA Oc 我 们 创建 一 组 数字 ， 用 来 表示 超过 9 的 余数 。 


from pythonds.basic.stack import Stack 


def baseConverter(decNumber, base): 
digits = "0123456789ABCDEF" 


remstack = Stack() 
while decNumber > 0: 
rem = decNumber % base 
remstack.push(rem) 
decNumber = decNumber // base 
newString = "" 
while not remstack.isEmpty(): 
newString = newString + digits[remstack.pop()] 
return newString 
print (baseConverter(25,2)) 


print (baseConverter( 25,16) ) 
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3.9. 中 绥 前 级 和 后 组 表达 式 


当 你 编写 一 个 算术 表达 式 如 B*c 时 ， 表 达 式 的 形式 使 你 能 够 正确 理解 它 。 在 这 种 情况 下 ， 你 
知道 B 乘 以 C, 因为 乘法 运算 符 * 出 现在 表达 式 中 。 这 种 类 型 的 符号 称 为 中 级 ， 因 为 运算 符 
在 它 处 理 的 两 个 操作 数 之 间 。 看 另外 一 个 中 组 示例 ， aee ， 运 算 符 + 和 + 仍然 出 现在 
操作 数 之 间 。 这 里 面 有 个 问题 是 ， 他 们 分 别 作 用 于 哪个 运算 数 上 ， + 作用 于 和信 和 B ,还 是 

* 作用 于 BB 和 C? 表达 式 似乎 有 点 模糊 。 


事实 上 ， 你 已 经 读 写 过 这 些 类 型 的 表达 式 很 长 一 段 时 间 ， 所 以 它们 对 你 不 会 导致 什么 问题 。 
这 是 因为 你 知道 运算 符 + 和 * 。 每 个 运算 符 都 有 一 个 优先 级 。 优 先 级 较 高 的 运算 符 在 优先 
级 较 低 的 运算 符 之 前 使 用 。 唯 一 改变 顺序 的 是 括号 的 存在 。 算 术 运 算 符 的 优先 顺序 是 将 乘法 
和 除法 置 于 加 法 和 减法 之 上 。 如 果 出 现 具有 相等 优先 级 的 两 个 运算 符 ， 则 使 用 从 左 到 右 的 顺 
序 排序 或 关联 。 


我 们 使 用 运算 符 优先 级 来 解释 下 表达 式 awc 。B 和 C 首先 相 乘 ， 然 后 将 人 与 该 结果 相 
加 。 (A+B)*C 将 强制 在 乘法 之 前 执行 人 和 B 的 加 法 。 在 表达 式 ArB+C 中 ， 最 左边 的 + 首先 
使 用 。 


虽然 这 一 切 对 你 来 说 都 很 明显 。 但 请 记 住 ， 计 算 机 需要 准确 知道 要 执行 的 操作 符 和 顺序 。 一 
种 保证 不 会 对 操作 顺序 产生 混淆 的 表达 式 的 方法 是 创建 一 个 称 为 完全 括号 表达 式 的 表达 式 。 
这 种 类 型 的 表达 式 对 每 个 运算 符 都 使 用 一 对 括号 。 括 号 没有 歧义 的 指示 操作 的 顺序 。 也 没有 
必要 记 住 任何 优先 规则 。 


表达 式 A+B*C+D 可 以 重 写 为 ((A + (B * C)) +d) ， 表 明 先 乘法 ， 然 后 是 左边 的 加 法 ，A+ 
B+C+D 可 以 号 为 (((A + B) + C) +d) ， 因 为 加 法 操作 从 左 向 右 相 关联 。 


有 两 种 非常 重要 的 表达 式 格式 ， 你 可 能 一 开始 不 会 很 明显 的 看 出 来 。 中 组 表达 式 ase, 如果 
我 们 移动 两 个 操作 数 之 间 的 运算 符 会 发 生 什 么 ? 结果 表达 式 变 成 + A B 。 同 样 ， 我 们 也 可 以 
将 运算 符 移动 到 结尾 ， 得 到 A B + ， 这 样 看 起 来 有 点 奇怪 。 


改变 操作 符 的 位 置 得 到 了 两 种 新 的 表达 式 格 式 ， 前 级 和 后 级 。 前 级 表达 式 符号 要 求 所 有 运算 
符 在 它们 处 理 的 两 个 操作 数 之 前 。 另 一 个 方面 ， 后 级 要 求 其 操作 符 在 相应 的 操作 数 之 后 。 看 
下 更 多 的 例子 ( 见 Table 2) 


A+B*C 将 在 前 组 中 写 为 + A* BC 。 乘 法 运算 符 紧 接 在 操作 数 B 和 C 之 前 ， 表 示 * 优先 
于 + 。 然 后 加 法 运算 符 出 现在 A 和 乘法 的 结果 之 前 。 


在 后 缀 中， 表达 式 将 是 AB c * + ， 再 次 ， 操 作 的 顺序 被 保留 ， 因 为 * 紧 接 在 BB 和 C 之 后 
出 现 ， 表 示 * 具有 高 优先 级 ， + 优先 级 低 。 虽 然 操作 符 在 它们 各 自 的 操作 数 前 后 移动 ， 但 
是 顺序 相对 于 彼此 保持 完全 相同 。 


Postfix 


Infix Expression Prefix Expression Expression 
A+B +AB AB+ 
A+B*C +A*BC ABC*+ 


Table 2 


现在 考虑 中 组 表达 式 (A + B) * C ， 回 想 下 ， 在 这 种 情况 下 ， 中 缓 需要 括号 在 乘法 之 前 强制 
执行 加 法 。 然 而 ， 当 A+B 写 到 前 组 中 时 ， 加 法 运算 符 简单 的 移动 到 操作 数 + AB 之 前 。 这 
个 操作 的 结果 成 为 乘法 的 第 一 个 操作 数 。 乘 法 运算 符 移动 到 整个 表达 式 的 前 面 ， 得 出 * + AB 
Cc ， 同 样 ， 在 后 级 A B + 中 ， 强 制 先 加 法 。 可 以 直接 对 该 结果 和 剩余 的 操作 数 C Re A 
后 ， 得 出 后 组 表达 式 为 AB+C*。 

再 次 考虑 这 三 个 表达 式 ( 见 Table 3) ° 括号 不 见 了 。 为 什么 在 前 级 和 后 级 的 时 候 不 需要 括号 了 
呢 ? 答 案 是 操作 符 对 于 他 们 的 操作 数 不 再 模糊 ， 只 有 中 组 才 需 要 括号 ， 前 级 和 后 组 表达 式 的 
操作 顺序 完全 由 操作 符 的 顺序 决定 。 


Postfix 
Infix Expression Prefix Expression Expression 
(A+B)*C *+ABC AB+C”* 
Table 3 
Table 4 展示 了 一 些 其 他 的 例子 
Postfix 
Infix Expression Prefix Expression Expression 
A+B*C+D ++A*BCD ABC*+D+ 
(A + B)*(C + D) *+AB+CD AB+CD+"* 
A*B+C*D +*AB*CD AB*CD*+ 
A+B+C+D +++ABCD AB+C+D+ 


Table 4 


3.9.1. 中 级 表达 式 转换 前 级 和 后 级 


到 目前 为 止 ， 我 们 已 经 使 用 特定 方法 在 中 组 表达 式 和 等 效 前 级 和 后 组 表达 式 符号 之 问 进行 转 
换 。 正 如 你 可 能 期 望 的 ， 有 一 些 算 法 来 执行 转换 ， 允 许 任何 复杂 表达 式 转换 。 


我 们 考虑 的 第 一 种 技术 使 用 前 面 讨论 的 完全 括号 表达 式 的 概念 。 回 想 一 下 ，A + B*C 可 以 
写成 (A + (B * Cc) ) ， 以 明确 标识 乘法 优先 于 加 法 。 然 而 ， 仔 细 观 察 ,你 可 以 看 到 每 个 括号 对 
还 表示 操作 数 对 的 开始 和 结束 ， 中 间 有 相应 的 运算 符 。 


看 上 面 的 子 表达 式 (Bic) 中 的 右 括 号 。 如 果 我 们 将 乘法 符号 移动 到 那个 位 置 ， 并 删除 匹配 
的 左 括号 ， 得 到 Bort ， 我 们 实际 上 已 经 将 子 表 达 式 转换 为 后 组 符号 。 如 果 加 法 运算 符 也 被 
移动 到 其 相应 的 右 括号 位 置 并 且 匹 配 的 左 括 号 被 去 除 ， 则 将 得 到 完整 的 后 组 表达 式 ( 见 


Figure 6) 。 


Figure 6 


如 果 我 们 不 是 将 符号 移动 到 右 括号 的 位 置 ， 我 们 将 它 向 左 移 动 ， 我 们 得 到 前 组 符号 ( 见 
Figure 7) 。 圆 括号 对 的 位 置 实 际 上 是 包含 的 运算 符 的 最 终 位 置 的 线索 。 


Figure 7 


所 以 为 了 转换 表达 式 ， 无 论 是 对 前 组 还 是 后 


先 根据 操作 的 顺序 把 表达 式 转换 成 完全 


括号 表达 式 。 然 后 将 包含 的 运算 符 移动 到 左 或 右 括号 的 位 置 ， 具 体 取决 于 需要 前 组 或 后 缓 符 


iza 


Zz 0 


这 里 面 有 个 更 复杂 的 例子 ，(A + B) *C - 


级 和 前 级 。 


D - E) * (F+6) ，Figure 8 显示 了 如 何 转换 为 后 


(A + B) * C - (D - E) * (F + G) 


(((A + B) * C) - ((D - E) * (F + G))) 
c- T 


Prefix 


-*+ABC*-DE+FG 


Figure 8 


3.9.2. 中 级 转 后 级 通用 法 


我 们 需要 开发 一 个 算法 来 将 任何 中 组 表达 式 转换 为 后 


看 看 转换 过 程 。 


Postfix 


AB+G"DEB- PG+” 


组 表达 式 。 为 了 做 到 这 一 点 ， 我 们 仔细 


再 次 考虑 表达 式 A+B*C。 如 上 所 示 ，A BC*+ 是 等 价 的 后 级 表达 式 。 我 们 已 经 注意 
到 ， 操 作 数 和，B 和 C 保持 在 它们 的 相对 位 置 。 只 有 操作 符 改变 位 置 。 再 看 中 级 表达 式 中 的 
运算 符 。 从 左 到 右 出 现 的 第 一 个 运算 符 为 +。 然而， 在 后 缀 表达 式 中 ，+ 在 结束 位 置 ， 因 为 
下 一 个 运算 符 * 的 优先 级 高 于 加 法 。 原 始 表达 式 中 的 运算 符 的 顺序 在 生成 的 后 组 表达 式 中 相 
反 。 


当 我 们 处 理 表达 式 时 ， 操 作 符 必须 保存 在 某 处 ， 因 为 它们 相应 的 右 操作 数 还 没有 看 到 。 此 
外 ， 这 些 保存 的 操作 符 的 顺序 可 能 由 于 它们 的 优先 级 而 需要 反 转 。 这 是 在 该 示例 中 的 加 法 和 
乘法 的 情况 ， 由 于 加 法 运算 符 在 乘法 运算 符 之 前 ， 并 且 具 有 较 低 的 优先 级 ， 因 此 需要 在 使 用 
乘法 运算 符 之 后 出 现 。 由 于 这 种 顺序 的 反 转 ， 考 虑 使 用 栈 来 保存 运算 符 直 到 用 到 它们 是 有 意 
义 的 。 


(A+B)* c 的 情况 会 是 什么 样 呢 ? 回想 一 下 ，A B + Cc * 是 等 价 的 后 级 表达 式 。 从 左 到 右 处 
理 此 中 级 表达 式 ， 我 们 先 看 到 + 。 在 这 种 情况 下 ， 当 我 们 看 到 * > + 已 经 放置 在 结果 表达 
式 中 ， 由 于 括号 它 的 优先 级 高 于 * 。 我 们 现在 可 以 开始 看 看 转换 算法 如 何 工 作 。 当 我 们 看 到 
左 括号 时 ， 我 们 保存 它 ， 表 示 高 优先 级 的 另 一 个 运算 符 将 出 现 。 该 操作 符 需要 等 到 相应 的 右 
括号 出 现 以 表示 其 位 置 (回忆 完全 括号 的 算法 ) © 当 右 括号 出 现时 ， 可 以 从 栈 中 弹出 操作 
符 。 


当 我 们 从 左 到 右 扫 描 中 组 表达 式 时 ， 我 们 将 使 用 栈 来 保留 运算 符 。 这 将 提供 我 们 在 第 一 个 例 
子 中 注意 到 的 反 转 。 堆栈 的 顶部 将 始终 是 最 近 保存 的 运算 符 。 每 当 我 们 读 取 一 个 新 的 运算 符 
时 ， 我 们 需要 考虑 该 运 工 符 如 何 与 已 经 在 栈 上 的 运 莫 符 〈 如 果 有 的 话 ) 比较 优先 级 。 


假设 中 组 表达 式 是 一 个 由 空格 分 隔 的 标记 字符 串 。 操作 符 标 记 是 *，/，+ 和 - ， 以 及 左右 括 
号 。 操 作 数 是 单字 符 A，B，C 等 。 以 下 步骤 将 后 组 顺序 生成 一 个 字符 串 。 


1. 创建 一 个 名 为 opstack 的 空 栈 以 保存 运算 符 。 给 输出 创建 一 个 空 列表 。 
2. 通过 使 用 字符 串 方 法 拆 分 将 输入 的 中 缓 字符 串 转 换 为 标记 列表 。 
3， 从 左 到 右 扫 描 标记 列表 。 
o 如 果 标 记 是 操作 数 ， 将 其 附加 到 输出 列表 的 末尾 。 
o 如 果 标 记 是 左 括 号 ， 将 其 压 到 opstack 上 。 
o 如 果 标 记 是 右 括号 ， 则 弹出 opstack， 直 到 删除 相应 的 左 括号 。 将 每 个 运算 符 附 加 到 
输出 列表 的 末尾 。 
o 如 果 标 记 是 运算 符 ，*，/，+ 或 - ， 将 其 压 入 opstack。 但 是 ， 首 先 删除 已 经 在 
opstack 中 具有 更 高 或 相等 优先 级 的 任何 运算 符 ， 并 将 它们 加 到 输出 列表 中 。 
4， 当 输入 表达 式 被 完全 处 理 时 ， 检 查 opstack。 仍 然 在 栈 上 的 任何 运算 符 都 可 以 删除 并 加 到 
输出 列表 的 末尾 。 


Figure 9 展示 了 对 表达 式 A* B+C*D 的 转换 算法 。 注 意 ， 第 一 个 * 在 看 到 + BHA 
时 被 删除 。 另 外 ， 当 第 二 个 * 出 现时 ， + 保留 在 栈 中 ， 因 为 乘法 优先 级 高 于 加 法 。 在 中 级 表 
达 式 的 末尾 ， 栈 被 弹出 两 次 ， 删 除 两 个 运算 符 ， 并 将 + 作为 后 组 表达 式 中 的 最 后 一 个 运算 
符 。 
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Figure 9 


为 了 在 Python 中 编写 算法 ， 我 们 使 用 一 个 名 为 prec 的 字典 来 保存 操作 符 的 优先 级 。 这 个 字 
典 将 每 个 运算 符 映 射 到 一 个 整数 ， 可 以 与 其 他 运算 符 的 优先 级 (我 们 使 用 整数 3，2 和 1) 进行 
比较 。 左 括号 将 赋予 最 低 的 值 。 这 样 ， 与 其 进行 比较 的 任何 运算 符 将 具有 更 高 的 优先 级 ， 将 
被 放置 在 它 的 顶部 。 第 15 行 将 操作 数 定义 为 任何 大 写字 符 或 数字 。 完 整 的 转换 函数 见 
ActiveCode 1 ° 


from pythonds.basic.stack import Stack 


def infixToPostfix(infixexpr): 
prec = {} 
prec["*"] 
prec["/"] 
prec["+" 


I ou oll 
NON W w 


prec["-"] 
prec("("] = 1 
opStack = Stack() 
postfixList = [] 


tokenList = infixexpr.split() 


for token in tokenList: 
if token in "ABCDEFGHIJKLMNOPQRSTUVWXYZ" or token in "0123456789": 
postfixList.append( token) 
elif token == '(': 
opStack.push(token) 
elif token == ')': 
topToken = opStack.pop() 
while topToken != '(': 
postfixList.append(topToken) 
topToken = opStack.pop() 
elise: 
while (not opStack.isEmpty()) and \ 
(prec[opStack.peek()] >= prec[token]): 
postfixList.append(opStack.pop() ) 
opStack.push(token) 


while not opStack.isEmpty(): 
postfixList.append(opStack.pop() ) 
return " ",join(postfixList ) 


print (infixToPostfix("A * B + C * D")) 
print(infixToPostfix("( A+B)*C-(D-E)* (F+t6G )")) 


执行 结果 如 下 


>>> infixtopostfix("( A+B) * (C+D )") 
ATB + CD 

>>> infixtopostfix("( A+B) * C") 

TPN [Bae (GY 

>>> infixtopostfix("A + B * C") 

PASBa Cat 

>>> 


作为 最 后 栈 的 示例 ， 我 们 考虑 对 后 缀 符号 中 的 表达 式 求 值 。 在 这 种 情况 下 ， 栈 再 次 是 我 们 选 
择 的 数据 结构 。 但 是 ， 在 扫描 后 级 表达 式 时 ， 它 必须 等 待 操作 数 ， 而 不 像 上 面 的 转换 算法 中 
的 运算 符 。 解决 问题 的 另 一 种 方法 是 ， 每 当 在 输入 上 看 到 运算 符 时 ， 计 算 两 个 最 近 的 操作 
数 。 


要 详细 的 了 解 这 一 点 ， 考 虑 后 级 表达 式 4 5 6 * + ， 首 先 遇 到 操作 数 4 和 5 ， 此 时 ， 你 
还 不 确定 如 何 处 理 它们 ， 直 到 看 到 下 一 个 符号 。 将 它们 放置 到 栈 上 ， 确 保 它 们 在 下 一 个 操作 
符 出 现时 可 用 。 


在 这 种 情况 下 ， 下 一 个 符号 是 另 一 个 操作 数 。 所 以 ， 像 先前 一 样 ， 压 入 栈 中 。 并 检查 下 一 个 
符号 。 现 在 我 们 看 到 了 操作 符 * ， 这 意味 着 需要 将 两 个 最 近 的 操作 数 相 乘 。 通 过 弹出 栈 两 
次 ， 我 们 可 以 得 到 正确 的 两 个 操作 数 ， 然 后 执行 乘法 (这 种 情况 下 结果 为 30) © 


我 们 现在 可 以 通过 将 其 放 回 栈 中 来 处 理 此 结果 ， 以 便 它 可 以 表示 为 表达 式 后 面 的 运算 符 的 操 
作 数 。 当 处 理 最 后 一 个 操作 符 时 ， 栈 上 只 有 一 个 值 ， 弹 出 并 返回 它 作 为 表达 式 的 结果 。Figure 
10 展示 了 整个 示例 表达 式 的 栈 的 内 容 。 





Left to Right Evaluation ———> 
4 5 6 
| push push pop twice 
push and do math 
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Figure 10 


Figure 11 是 个 稍微 复杂 的 示例 ，7 8 + 3 2 + / 。 在 这 个 例子 中 有 两 点 需要 注意 ， 首 先 ， 栈 
的 大 小 增长 收缩 ， 然 后 再 子 表达 式 求 值 的 时 候 再 次 增长 。 第 二 ， 除 法 操作 需要 自信 和 处理。 回 
想 下 ， 后 级 表达 式 的 操作 符 顺 序 没 变 ， 仅 仅 改 变 操作 符 的 位 置 。 当 用 于 除法 的 操作 符 从 栈 中 
弹出 时 ， 它 们 被 反 转 。 由 于 除法 不 是 交换 运算 符 ， 换 句 话 说 15/5 和 5/15 不 同 ， 因 此 我 们 


必须 保证 操作 数 的 顺序 不 会 交换 。 
| 3 


w 





Figure 11 


假设 后 组 表达 式 是 一 个 由 空格 分 隔 的 标记 字符 串 。 BARA ++ 7-4 和 - ， 操 作 数 假定 为 单 
个 整数 值 。 输 出 将 是 一 个 整数 结果 。 


创建 一 个 名 为 operandStack 的 空 栈 。 
2. KÀ 字符 串 转 换 为 标记 列表 。 
3， 从 左 到 右 担 描 标记 列表 。 
o 如 果 标 记 是 操作 数 ， 将 其 从 字符 串 转 换 为 整数 ， 并 将 值 压 到 operandStack。 
o 如 果 标 记 是 运算 符 *,，/,+ 或 - ， 它 将 需要 两 个 操作 数 。 弹 出 operandStack 两 次 。 
第 一 个 弹出 的 是 第 二 个 操作 数 ， 第 二 个 弹出 的 是 第 一 个 操作 数 。 执 行 算 术 运算 后 ， 
将 结果 压 到 操作 数 栈 中 。 
4， 当 输入 的 表达 式 被 完全 处 理 后 ， 结 果 就 在 栈 上 ， 弹 出 operandStack 并 返回 值 。 


用 于 计算 后 级 表达 式 的 完整 函数 见 ActiveCode 2， 为 了 辅助 计算 ， 定 义 了 一 个 函数 doMath, 
它 将 获取 两 个 操作 数 和 运算 符 ， 执 行 相 应 的 计算 。 


from pythonds.basic.stack import Stack 


def postfixEval(postfixExpr): 
operandStack = Stack() 
tokenList = postfixExpr.split() 


for token in tokenList: 
if token in "0123456789": 
operandStack.push(int( token) ) 
elise: 
operand2 = operandStack.pop() 
operandi = operandStack.pop() 
result = doMath(token, operandi, operand2) 
operandStack.push(result ) 
return operandStack.pop() 


def doMath(op, opi, op2): 
if op == "*": 
return opi * op2 
elif op == "/": 
return opi / op2 
elif op == "+": 
return opi + op2 
else: 
return opi - op2 


print(postfixEval('7 8+ 3 2 + /')) 


3.10. 什 么 是 队列 


队列 是 项 的 有 序 结合 ， 其 中 添加 新 项 的 一 端 称 为 队 尾 ， 移 除 项 的 一 端 称 为 队 首 。 当 一 个 元 素 
从 队 尾 进入 队列 时 ， 一 直 向 队 首 移动 ， 直 到 它 成 为 下 一 个 需要 移 除 的 元 素 为 止 。 


最 近 添 加 的 元 素 必须 在 队 尾 等 待 。 集 合 中 存活 时 间 最 长 的 元 素 在 队 首 ， 这 种 排序 成 为 FIFO ， 
先进 先 出 ， 也 被 成 为 先 到 先 得 。 


队列 的 最 简单 的 例子 是 我 们 平时 不 时 会 参与 的 列 。 排 队 等 待 电影 ， 在 杂货 店 的 收 营 台 等 待 ， 
在 自助 餐厅 排队 等 待 (这 样 我 们 可 以 弹出 托盘 栈 ) 。 Ey 良好 的 线 或 队列 是 有 限制 的 ， 因 为 
它 只 有 一 条 路 ， 只 有 一 条 出 路 。 不 能 插队 ， 也 不 能 离开 。 你 只 有 等 待 了 一 定 的 时 间 才 能 到 前 
面 。Figure 1 展示 了 一 个 简单 的 Python 对 象 队 列 。 





items 


Figure 1 


计算 机 科学 也 有 常见 的 队列 示例 。 我 们 的 计算 机 实验 室 有 30 台 计 算 机 与 一 台 打 印 机 联网 。 当 
学 生 想 要 打印 时 ， 他 们 的 打印 任务 与 正在 等 待 的 所 有 其 他 打印 任务 “一致 "。 第 一 个 进入 的 任务 
是 先 完成 。 如 果 你 是 最 后 一 个 ， 你 必须 等 待 你 前 面 的 所 有 其 他 任务 打印 。 我 们 将 在 后 面 更 详 

细 地 探讨 这 个 有 趣 的 例子 


除了 打印 队列 ， 操 作 系 统 使 用 多 个 不 同 的 队列 来 控制 计算 机 内 的 进程 。 下 一 步 做 什么 的 调度 

通常 基于 尽 可 能 enameled KARA AP ABER o tush > SRN HEA 
时 ， 有 时 屏幕 上 出 现 的 字符 会 这 是 由 于 计算 机 在 那 一 刻 做 其 他 工作 。 按 键 的 内 容 被 放 
置 在 类 似 队 列 的 缓冲 器 中 ， P 以 正确 的 顺序 显示 在 屏幕 上 。 


3.11. 队 列 抽 胃 数据 类 型 


队列 抽象 数据 类 型 由 以 下 结构 和 操作 定义 。 如 上 所 述 ， 队 列 被 构造 为 在 队 尾 添加 项 的 有 序 集 
合 ， 并 且 从 队 首 移 除 。 队 列 保持 FIFO 排序 属性 。 队列 操作 如 下 。 


。 Queue() 创建 一 个 空 的 新 队列 。 它 不 需要 参数 ， 并 返回 一 个 空 队 列 。 

。 enqueue(item) 将 新 项 添加 到 队 尾 。 它 需要 item 作为 参数 ， 并 不 返回 任何 内 容 。 
e dequeue() 从 队 首 移 除 项 。 它 不 需要 参数 并 返回 item。 队列 被 修改 。 

。 isEmpty() 查看 队列 是 否 为 室 。 它 不 需要 参数 ， 并 返回 布尔 值 。 

。 size() 返回 队列 中 的 项 数 。 它 不 需要 参数 ， 并 返回 一 个 整数 。 


作为 示例 ， 我 们 假设 q 是 已 经 创建 并 且 当 前 为 空 的 队列 ， 则 Table 1 展示 了 队列 操作 序列 的 结 
果 。 右 边 表示 队 首 。4 是 第 一 个 入 队 的 项 ， 因 此 它 dequeue 返回 的 第 一 个 项 。 


Queue Operation Queue Contents Return Value 
q.isEmpty() 口 True 
q.enqueue(4) [4] 

q.enqueue(' dog’) ['dog’ ,4] 

q.enqueue(True) [True, 'dog' ,4] 

q.size() [True, 'dog' ,4] 3 
q.isEmpty() (True, 'dog' ,4] False 
q.enqueue(8 .4) [8.4,True, 'dog' ,4] 

q.dequeue() [8.4,True, dog '] 4 
q.dequeue() [8.4,True] "dog 
q.size() [8.4, True] 2 


Table 1 


3.12.Python 实 现 队 列 


我 们 为 了 实现 队列 抽象 数据 类 型 创建 一 个 新 类 。 和 前 面 一 样 ， 我 们 将 使 用 列表 集合 来 作为 构 
建 队列 的 内 部 表示 。 


我 们 需要 确定 列表 的 哪 一 端 作为 队 首 ， 哪 一 端 作为 队 尾 。Listing 1 所 示 的 实现 假定 队 尾 在 列 
表 中 的 位 置 为 0。 这 允许 我 们 使 用 列表 上 的 插入 函数 向 队 尾 添加 新 元 素 。 弹 出 操作 可 用 于 删除 
队 首 的 元 素 (列表 的 最 后 一 个 元 素 ) 。 回 想 一 下 ， 这 也 意味 着 入 队 为 O(n)， 出 队 为 O(1)。 


class Queue : 
def init__(self): 
self.items = [] 


def isEmpty(self): 
return self.items == [] 


def enqueue(self, item): 
self .items.insert(0,item) 


def dequeue(self): 
return self.items.pop() 


def size(self): 
return len(self.items) 


Listing 1 


进一步 的 操作 这 个 队列 产生 如 下 结果 : 


>>> q.size() 

3 

>>> q.isEmpty() 
False 

>>> q.enqueue(8.4) 
>>> q.dequeue( ) 
4 

>>> q.dequeue( ) 
"dog! 

>>> q.size() 

2 


3.13. 模 拟 : ZF LS 


队列 的 典型 应 用 之 一 是 模拟 需要 以 FIFO 方式 管理 数据 的 站 实 场景 。 首 先 ， 让 我 们 看 看 孩子 们 
的 游戏 梁 手 山芋， 在 这 个 游戏 中 ( 见 Figure 2) ， 和 孩子 们 围 成 一 个 圈 ， 并 尽 可 能 快 的 将 一 个 
山芋 递 给 房 边 的 孩子 。 在 某 一 个 时 间 ， 动 作 结 束 ， 有 山芋 的 孩子 从 圈 中 移 除 。 游 戏 继续 开始 
直到 剩 下 最 后 一 个 孩子 。 






After 5 passes 


Brad is eliminated pass to next person 


until predefined counting constant and so on 


Figure 2 


这 个 游戏 相当 于 著名 的 约瑟夫 问题 ， 一 个 一 世纪 著名 历史 学 家 上 弗 拉 维 奥 :约瑟夫 斯 的 传奇 故 

事 。 故 事 讲 的 是 ， 他 和 他 的 39 个 战友 被 罗马 军队 包围 在 洞 中 。 他 们 决定 宁愿 死 ， 也 不 成 为 罗 
马 人 的 奴隶 。 他 们 围 成 一 个 圈 ， 其 中 一 人 被 指定 为 第 一 个 人 ， 顺 时 针 报 数 到 第 七 人 ， 就 将 他 
杀 死 。 约 瑟 夫 斯 是 一 个 成 功 的 数学 家 ， 他 立即 想 出 了 应 该 坐 到 哪 才能 成 为 最 后 一 人 。 最 后 ， 

他 加 入 了 罗马 的 一 方 ， 而 不 是 杀 了 自己 。 你 可 以 找到 这 个 故事 的 不 同 版 本 ， 有 些 说 是 每 次 报 
数 3 个 人 ， 有 人 说 允许 最 后 一 个 人 逃跑 。 无 论 如 何 ， 思 想 是 一 样 的 。 


我 们 将 模拟 这 个 尖山 苹 的 过 程 。 我 们 的 程序 将 输入 名 称 列 表 和 一 个 称 为 num 常量 用 于 报 数 。 
它 将 返回 以 num 为 单位 重复 报 数 后 剩余 的 最 后 一 个 人 的 姓名 。 


为 了 模拟 这 个 圈 ， 我 们 使 用 队列 (I Figure3) 。 假 设 拿 着 山芋 的 孩子 在 队列 的 前 面 。 当 拿 到 
山 尝 的 时 候 ， 这 个 孩子 将 先 出 列 再 入 队列 ， 把 他 放 在 队列 的 最 后 。 经 过 num 次 的 出 队 入 队 
后 ， 前 面 的 孩子 将 被 永久 移 除 队列 。 并 且 另 一 个 周期 开始 ， 继 续 此 过 程 ， 直 到 只 剩 下 一 个 名 
字 (队列 的 大 小 为 1) 。 


3.13. 模 拟 : BFF 


一 
rear ——® Brad Kent Jane Susan David Bill ——e pe 





enqueue dequeue 


ee Go to the rear 
(Pass the potato) 


tT 


rear ——* Bill Brad Kent Jane Susan David —+£ front 


ee 


Figure 3 


from pythonds.basic.queue import Queue 
def hotPotato(namelist, num): 
simqueue = Queue() 
for name in namelist: 
simqueue. enqueue(name ) 
while simqueue.size() > 1: 
for i in range(num): 
simqueue. enqueue(simqueue.dequeue( ) ) 
simqueue.dequeue( ) 


return simqueue.dequeue( ) 


print(hotPotato(["Bill", "David", "Susan", "Jane", "Kent", "Brad"],7)) 


Active code 1 


请 注意 ， 在 此 示例 中 ， 计 数 常 数 的 值 大 于 列表 中 的 名 称 数 。 这 不 是 一 个 问题 ， 因 为 队列 像 一 
Bo HRA ESHA > BAAS Mo AW? HIER? Dl RRA DA PUMA 
上 的 名 字 位 于 队列 的 前 面 。 在 这 种 情况 下 ， Bill 是 列表 中 的 第 一 个 项 ， 因 此 他 在 队列 的 前 


Wo 


65 


3.14. 模 拟 : 打印 机 


一 个 更 有 趣 的 模拟 是 允许 我 们 研究 本 节 前 面 描述 的 打印 机 的 行为 ， 回 想 一 下 ， 当 学 生 向 共享 
打印 机 发 送 打印 任务 时 ， 任 务 被 放置 在 队列 中 以 便 以 先 来 先 服 务 的 方式 被 处 理 。 此 配置 会 出 
现 许 多 问题 。 其 中 最 重要 的 点 可 能 是 打印 机 是 否 能 够 处 理 一 定量 的 工作 。 如 果 它 不 能 ， 学 生 
将 等 待 太 长 时 间 打 印 ， 可 能 会 错过 他 们 的 下 一 节 课 。 


在 计算 机 科学 实验 室 里 考虑 下 面 的 情况 。 平 均 每 天 大 约 10 名 学 生 在 任何 给 定时 间 在 实验 室 工 
作 。 这 些 学 生 通 常 在 此 期 间 打 印 两 次 ， 这 些 任 务 的 长 度 范围 从 1 到 20 页 。 实 验 室 中 的 打印 机 较 
日， 每 分 钟 以 草稿 质量 可 以 处 理 10 页 。 打 印 机 可 以 切换 以 提供 更 好 的 质量 ， 但 是 它 将 每 分 钟 
只 能 处 理 五 页 。 较 慢 的 打印 速度 可 能 会 使 学 生 等 待 太 久 。 应 使 用 什么 页 面 速率 ? 

我 们 可 以 通过 建立 一 个 模拟 实验 来 决定 。 我 们 将 需要 为 学 生 ， 打 印 任务 和 打印 机 构建 表现 表 
示 (Figure4) 。 当 学 生 提 交 打 印 任务 时 ， 我 们 将 把 他 们 添加 到 等 待 列 表 中 ， 一 个 打印 任务 的 
队列 。 当 打 印 机 完成 任务 时 ， 它 将 检查 队列 ， 以 检查 是 否 有 剩余 的 任务 要 处 理 。 我 们 感 兴趣 
的 是 学 生 等 待 他 们 的 论文 打印 的 平均 时 间 。 这 等 于 任务 在 队列 中 等 待 的 平均 时 间 量 。 
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Figure 4 
为 了 为 这 种 情况 建 模 ， 我 们 需要 使 用 一 些 概率 。 例 如 ， 学 生 可 以 打印 长 度 从 1 到 20 页 的 纸 


张 。 如 果 从 1 到 20 的 每 个 长 度 有 同样 的 可 能 性 ， 则 可 以 通过 使 用 1 和 20 之 间 的 随机 数 来 模 
拟 打 印 任务 的 实际 长 度 。 这 意味 着 出 现 从 1 到 20 的 任何 长 度 的 机 会 是 平等 的 。 


如 果实 验 室 中 有 10 个 学 生 ， 每 人 打印 两 次 ， 则 平均 每 小 时 有 20 个 打印 任务 。 在 任何 给 定 的 
秒 ， 打 印 任务 将 被 创建 的 机 会 是 什么 ? 回答 这 个 问题 的 方法 是 考虑 任务 与 时 间 的 比率 。 每 小 
时 20 个 任务 意味 着 平均 每 180 秒 将 有 一 个 任务 : 


20 tasks 1 hour ] minute 1 task 


1 hour 60 minutes 60 seconds ~ 180 seconds 





对 于 每 一 秒 ， 我 们 可 以 通过 生成 1 到 180 之 间 的 随机 数 来 模拟 打印 任务 发 生 的 机 会 。 如 果 数 
字 是 180， 我 们 说 一 个 任务 已 经 创建 。 请 注意 ， 可 能 会 在 一 下 子 创建 许多 任务 ， 或 者 需要 竺 
待 一 段 时 间 才 有 任务 。 这 就 是 模拟 的 本 质 。 你 想 模拟 趴 实 的 情况 就 需要 尽 可 能 接近 一 般 参 
数 。 


3.14.1. 主 要 模拟 步骤 


1. 创建 打印 任务 的 队列 ， 每 个 任务 都 有 个 时 间 戳 。 队 列 启 动 的 时 候 为 空 。 
2. 每 秒 (currentSecond ) 


o 是 否 创建 新 的 打印 任务 ? 如 果 是 ， 将 currentsecond 作为 时 间 改 添加 到 队列 。 
o 如 果 打 印 机 不 忙 并 且 有 任务 在 等 待 
从 打印 机 队列 中 删除 一 个 任务 并 将 其 分 配给 打印 机 
= 从 currentSecond 中 减 去 时 间 玲 ， 以 计算 该 任务 的 等 待 时 间 。 
a 将 该 任务 的 等 待 时 间 附 件 到 列表 中 稍 后 处 理 。 
m 根据 打印 任务 的 页 数 ， 确 定 需 要 多 少时 间 。 
o 打印 机 需要 一 秒 打 印 ， 所 以 得 从 该 任务 的 所 需 的 等 待 时 间 减 去 一 秒 。 
o 如 果 任 务 已 经 完成 ， 换 名 话说， 所 需 的 时 间 已 经 达到 零 ， 打 印 机 空闲 。 
3， 模 拟 完 成 后 ， 从 生成 的 等 待 时 间 列 表 中 计算 平均 等 待 时 间 。 


3.14.2 Python 实现 


为 了 设计 此 模拟 ， 我 们 将 为 上 述 三 个 站 实 世界 对 象 创建 类 : printer ，Task , PrintQueue 


Printer 类 (Listing2) 需要 跟踪 它 当 前 是 否 有 任务 。 如 果 有 ， 则 它 处 于 忙碌 状态 〈13-17 
行 )， 并 且 可 以 从 任务 的 页 数 计 算 所 需 的 时 间 。 构 造 函 数 允 许 初 始 化 每 分 钟 页 面 的 配 
置 tick 方法 将 内 部 定时 器 递减 直到 打印 机 设置 为 室 闲 (11 行 ) 


class Printer: 


def 


def 


def 


def 


Listing 2 


task 类 (Listing3) 表示 单个 打印 任务 。 创 建 任务 时 ， 随 机 数 生 成 器 将 提供 1 到 20 页 的 长 


init__(self, ppm): 
self.pagerate = ppm 
self.currentTask = None 
self.timeRemaining = 0 


tick(self): 
if self.currentTask != None: 
self.timeRemaining = self.timeRemaining - 1 
if self.timeRemaining <= 0: 
self.currentTask = None 


busy(self): 

if self.currentTask != None: 
return True 

else: 
return False 


startNext(self, newtask): 
self.currentTask = newtask 
self.timeRemaining = newtask.getPages() * 60/self.pagerate 


度 。 我 们 选择 使 用 随机 模块 中 的 randrange 函数 。 


>>> import random 


>>> random.randrange(1, 21) 


18 


>>> random.randrange(1, 21) 


8 


>>> 


每 个 任务 还 需要 保存 一 个 时 间 惟 用 于 计算 等 待 时 间 。 此 时 间 改 将 表示 任务 被 创建 并 放置 到 打 
印 机 队列 中 的 时 间 。 可 以 使 用 _ waitTime 方法 来 检索 在 打印 开始 之 前 队列 中 花费 的 时 间 。 


Import random 


class Task: 
def init__(self, time): 
self.timestamp = time 
self.pages = random.randrange(1, 21) 


def getStamp(self): 
return self.timestamp 


def getPages(self): 
return self.pages 


def waitTime(self, currenttime): 
return currenttime - self.timestamp 


Listing 3 


Listing 4 实现 了 上 述 算法 。 printqueue 对 象 是 我 们 现 有 队列 ADT 的 一 个 实 

例 。 newprintTask 决定 是 否 创 建 一 个 新 的 打印 任务 。 我 们 再 次 选择 使 用 随机 模块 的 
randrange ak3R 1 到 180 之 间 的 随机 整数 。 打 印 任务 每 180 秒 到 达 一 次 。 通 过 从 随机 整 

数 (3247) 的 范围 中 任意 选择 ， 我 们 可 以 模拟 这 个 随机 事件 。 模 拟 功 能 允许 我 们 设置 打印 机 
的 总 时 间 和 每 分 钟 的 页 数 。 


from pythonds.basic.queue import Queue 
import random 
def simulation(numSeconds, pagesPerMinute): 


labprinter = Printer(pagesPerMinute) 
printQueue = Queue() 
waitingtimes = [] 


for currentSecond in range(numSeconds): 


if newPrintTask(): 
task = Task(currentSecond) 
printQueue.enqueue(task) 


if (not labprinter.busy()) and (not printQueue.isEmpty()): 
nexttask = printQueue.dequeue( ) 
waitingtimes.append(nexttask.waitTime(currentSecond) ) 
labprinter.startNext(nexttask) 


labprinter.tick() 


averageWait=sum(waitingtimes)/len(waitingtimes) 
print("Average Wait %6.2f secs %3d tasks remaining."%(averageWait, printQueue.size( 


))) 


def newPrintTask(): 
num = random.randrange(1,181) 
if num == 180: 
return True 
else: 
return False 


for i in range(10): 
simulation(3600,5) 
Listing 4 


当 我 们 运行 模拟 时 ， 我 们 不 应 该 担心 每 次 的 结果 不 同 。 这 是 由 于 随机 数 的 概率 性 质 决定 的 。 
因为 模拟 的 参数 可 以 被 调整 ， 我 们 对 调整 后 可 能 发 生 的 趋势 感 兴趣 。 这 里 有 一 些 结果 。 


首先 ， 我 们 将 使 用 每 分 钟 五 页 的 页 面 速率 运行 模拟 60 分 钟 (3,600 秒 ) 。 此 外 ， 我 们 将 进行 
10 次 独立 试验 。 记 住 ， 因 为 模拟 使 用 随机 数 ， 每 次 运行 将 返回 不 同 的 结果 。 


>>>for i In range(10): 
simulation(3600,5) 
Average Wait 165.38 secs tasks remaining. 
Average Wait 95.07 secs tasks remaining. 
Average Wait 65.05 secs tasks remaining. 
Average Wait 99.74 secs tasks remaining. 
Average Wait 17.27 secs tasks remaining. 
Average Wait 239.61 secs tasks remaining. 
Average Wait 75.11 secs tasks remaining. 
Average Wait 48.33 secs tasks remaining. 


Average Wait 39.31 secs tasks remaining. 
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Average Wait 376.05 secs tasks remaining. 


在 运行 10 次 实验 后 ， 我 们 可 以 看 到 ， 平 均等 待 时 间 为 122.09 ° 还 可 以 看 到 平均 等 待 时 间 
有 很 大 的 变化 ， 最 小 值 为 17.27 秒 ， 最 大 值 为 376.05 to 你 也 可 能 注意 到 ， 只 有 两 种 情况 
所 有 任务 都 完成 。 


现在 ， 我 们 将 页 面 速率 调整 为 每 分 钟 10 页 ， 再 次 运行 10 次 测试 ， 页 面 速度 更 快 ， 我 们 希望 
在 一 小 时 内 完成 更 多 的 任务 。 


>>>for i in range(10): 
simulation(3600,10) 
Average Wait 1.29 secs tasks remaining. 
Average Wait 7.00 secs tasks remaining. 
Average Wait 28.96 secs tasks remaining. 
Average Wait 13.55 secs tasks remaining. 
Average Wait 12.67 secs tasks remaining. 
Average Wait 6.46 secs tasks remaining. 
Average Wait 22.33 secs tasks remaining. 
Average Wait 12.39 secs tasks remaining. 


Average Wait 7.27 secs tasks remaining. 
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Average Wait 18.17 secs tasks remaining. 


3.14.3. 讨 论 


我 们 试图 回答 一 个 问题 ， 即 当前 打印 机 
量 ， 较 慢 的 页 面 速 罕 。 我 们 采用 的 方法 
随机 事件 的 模拟 。 


是 否 可 以 处 理 任务 负载 ， 如 果 它 设置 为 打印 更 好 的 质 
是 编写 


否 
编写 一 个 模拟 打印 任务 作为 各 种 页 数 和 到 达 时 间 的 
上 面 的 输出 显示 ， 每 分 钟 打印 5 页 ， 平 均等 待 时 间 从 低 的 17 秒 到 高 的 376 秒 ( 约 6 分 
钟 )。 使 用 更 快 的 打印 速 举 ， 低 值 为 1 秒 ， 高 值 仅 为 28。 此 外 ， 在 10 次 运行 中 的 8 次 ， 每 
分 钟 5 页 ， 打 印 任务 在 结束 时 仍 在 队列 中 等 待 。 


因此 ， 我 们 说 减 慢 打印 机 的 速度 以 获得 更 好 的 质量 可 能 不 是 一 个 好 主意 。 学 生 们 不 能 等 待 他 
们 的 论文 打印 完 ， 特 别 是 当 他 们 需要 到 下 一 个 班级 。 六 分 钟 的 等 待 时 间 太 长 了 。 


这 种 类 型 的 模拟 分 析 人 允许 我 们 回答 许多 问题 ， 通 常 被 称 为 "如 果 " 的 问题 。 我 们 需要 做 的 是 改变 
模拟 使 用 的 参数 ， 我 们 可 以 模拟 任何 数量 。 例 如 


* 如 果 入 学 人 数 增加 ， 平 均 学 生 人 数 增加 20 人 该 怎么 办 ? 
* 如 果 是 星期 六 ， 学 生 不 需要 上 课 怎 么 办 ?他 们 能 负担 得 了 吗 ? 
* 如 果 平均 打印 任务 的 大 小 减少 了 ， 由 于 Python 是 一 个 强大 的 语言 ， 程 序 往往 要 短 得 多 ? 


这 些 问题 都 可 以 通过 修改 上 述 模拟 来 回答 。 然 而 ， 重 要 的 是 要 记 住 ， 模 拟 有 效 取决 于 构建 它 
的 假设 是 没 问 题 的 。 关 于 每 小 时 打印 任务 的 数量 和 每 小 时 的 学 生 数 量 的 丨 实数 据 对 于 构建 鲁 
棒 性 的 模拟 是 必要 的 。 


3.15. 什 么 是 Deque 


deque (也 称 为 双 端 队列 ) 是 与 队列 类 似 的 项 的 有 序 集 合 。 它 有 两 个 端 部 ， 首 部 和 尾部 ， 并 且 
项 在 集合 中 保持 不 变 。deque 不 同 的 地 方 是 添加 和 删除 项 是 非 限制 性 的 。 可 以 在 前 面 或 后 面 
添加 新 项 。 同 样 ， 可 以 从 任 一 端 移 除 现 有 项 。 在 某 种 意义 上 ， 这 种 混合 线性 结构 提供 了 单个 
数据 结构 中 的 栈 和 队列 的 所 有 能 力 。 Figure 1 展示 了 一 个 Python 数据 对 象 的 deque 。 


要 注意 ， 即 使 deque 可 以 拥有 栈 和 队列 的 许多 特性 ， 它 不 需要 由 那些 数据 结构 强制 的 LIFO 
和 FIFO 排序 。 这 取决 于 你 如 何 持续 添加 和 删除 操作 。 


rear front 


add to rear add to front 
~ 
“dog” 4 ‘cat’ True 
A S 
remove from rear items remove from front 


Figure 1 


3.16.Deque4h % žE KA 


deque 抽象 数据 类 型 由 以 下 结构 和 操作 定义 。 如 上 所 述 ，deque 被 构造 为 项 的 有 序 集 合 ， 其 
中 项 从 首部 或 尾部 的 任 一 端 添加 和 移 除 。 下 面 给 出 了 deque 操作 。 


。 Deque() 创建 一 个 空 的 新 deque。 它 不 需要 参数 ， 并 返回 空 的 deque。 

e addFront(item) 将 一 个 新 项 添加 到 deque 的 首部 。 它 需要 item 参数 并 不 返回 任何 内 容 。 
e addRear(item) 将 一 个 新 项 添加 到 deque 的 尾部 。 它 需要 item 参数 并 不 返回 任何 内 容 。 
e removeFront() 从 deque 中 删除 首 项 。 它 不 需要 参数 并 返回 item ° deque 被 修改 。 

e removeRear() 从 deque 中 删除 尾 项 。 它 不 需要 参数 并 返回 item ° deque 被 修改 。 

e isEmpty() 测试 deque 是 否 为 室 。 它 不 需要 参数 ， 并 返回 布尔 值 。 

e size() 返回 deque 中 的 项 数 。 它 不 需要 参数 ， 并 返回 一 个 整数 。 


例如 ， 我 们 假设 d 是 已 经 创建 并 且 当 前 为 空 的 deque， 则 Table 1 展示 了 一 系列 deque 操作 
的 结果 。 注 意 ， 首 部 的 内 容 列 在 右边 。 在 将 item 移入 和 移出 时 ， 跟 踪 前 面 和 后 面 是 非常 重要 
的 ， 因 为 可 能 会 有 点 混乱 。 


Deque Operation Deque Contents Return Value 
d.isEmpty() 口 True 
d.addRear(4) [4] 

d.addRear(' dog") [ "dog ,4,] 

d.addFront('cat') ['dog' ,4,'cat'] 

d.addFront(True) ['dog' ,4, 'cat', True] 

d.size() ['dog' ,4, 'cat', True] 4 
d.isEmpty() ['dog',4, 'cat', True] False 
d.addRear(8.4) [8.4,'dog',4, ‘cat’, True] 
d.removeRear() ['dog' ,4, 'cat', True] 8.4 
d.removeFront() ['dog’,4,'cat'] True 


Table 1 


3.17.Python 实 现 Deque 


正如 我 们 在 前 面 的 部 分 中 所 做 的 ， 我 们 将 为 抽象 数据 类 型 deque 的 实现 创建 一 个 新 类 。 同 
样 ，Python 列表 将 提供 一 组 非常 好 的 方法 来 构建 deque 的 细节 。 我 们 的 实现 (Listing 1) 将 
假定 deque 的 尾部 在 列表 中 的 位 置 为 0。 


class Deque: 


def _ init__(self): 
self.items = [] 


def isEmpty(self): 
return self.items == [] 


def addFront(self, item): 
self .items.append(item) 


def addRear(self, item): 
self.items.insert(0, item) 


def removeFront(self): 
return self.items.pop() 


def removeRear(self): 
return self.items.pop(0) 


def size(self): 
return len(self.items) 


Listing 1 
在 removeFront 中 ， 我 们 使 用 pop 方法 从 列表 中 删除 最 后 一 个 元 素 。 但是， 在 removeRear 


中 ，pop(0) 方 法 必须 删除 列表 的 第 一 个 元 素 。 同 样 ， 我 们 需要 在 addRear 中 使 用 insert 方 法 
(第 12 行 ) ， 因 为 append 方法 在 列表 的 末尾 添加 一 个 新 元 素 。 


你 可 以 看 到 许多 与 栈 和 队列 中 描述 的 Python 代码 相似 之 处 。 你 也 可 能 观察 到 ， 在 这 个 实现 
中 ， 从 前 面 添加 和 删除 项 是 DO(1)， 而 从 后 面 添加 和 删除 是 O(n)。 考虑 到 添加 和 删除 项 是 出 现 
的 常见 操作 ， 这 是 可 预期 的 。 同样 ， 重 要 的 是 要 确定 我 们 知道 在 实现 中 前 后 都 分 配 在 哪里 。 


3.18. 回 文 检查 


使 用 deque 数据 结构 可 以 容易 地 解决 经 典 回 文 问 题 。 回 文 是 一 个 字符 串 ， 读 取 首 尾 相同 的 字 
符 ， 例 如 ， radar toot madam 。 我 们 想 构造 一 个 算法 输入 一 个 字符 串 ， 并 检查 它 是 否 是 一 个 
回 文 。 

该 问题 的 解决 方案 将 使 用 deque 来 存储 字符 串 的 字符 。 我 们 从 左 到 右 处 理 字符 囊 ， 并 将 每 个 
字符 添加 到 deque 的 尾部 。 在 这 一 点 上 ， deque 像 一 个 普通 的 队列 。 然 而 ， 我 们 现在 可 以 利 
用 deque 的 双重 功能 。deque 的 首部 保存 字符 串 的 第 一 个 字符 ，deque 的 尾部 保存 最 后 一 个 


字符 (IL Figure2) 。 


Add "radar to the rear 


rear front 
add to rear 


items 


rear front 


remove from rear items remove from front 
r r 
Remove from front and rear 


Figure 2 


我 们 可 以 直接 删除 并 比较 首尾 字符 ， 只 有 当 它 们 匹配 时 才 继 续 。 如 果 可 以 持续 匹配 首尾 字 
符 ， 我 们 最 终 要 么 用 完 字符 ， 要 么 留 出 大 小 为 1 的 deque， 取 决 于 原始 字符 串 的 长 度 是 偶数 还 
是 奇数 。 在 任 一 情况 下 ， 字 符 串 都 是 回 文 。 回 文 检查 的 完整 功能 在 ActiveCode 1 中 。 


from pythonds.basic.deque import Deque 


def palchecker(aString): 
chardeque = Deque() 


for ch in aString: 
chardeque.addRear (ch) 


stillEqual = True 
while chardeque.size() > 1 and stillEqual: 
first = chardeque.removeFront() 
last = chardeque.removeRear () 
if first != last: 
stillEqual = False 


return stillEqual 


print (palchecker("lsdkjfskf")) 
print(palchecker ("radar") ) 


ActiveCode 1 


3.19. 列 表 


在 对 基本 数据 结构 的 讨论 中 ， 我 们 使 用 Python 列表 来 实现 所 呈现 的 抽象 数据 类 型 。 列 表 是 一 
个 强大 但 简单 的 收集 机 制 ， 为 程序 员 提 供 了 各 种 各 样 的 操作 。 然 而 ， 不 是 所 有 的 编程 语言 
包括 列表 集合 。 在 这 些 情况 下 ， 列 表 的 概念 必须 由 程序 员 实 现 。 

列表 是 项 的 集合 ， 其 中 每 个 项 保持 相对 于 其 他 项 的 相对 位 置 。 更 具体 地 ， 我 们 将 这 种 类 型 的 
列表 称 为 无 序列 表 。 我 们 可 以 将 列表 视 为 具有 第 一 项 ， 第 二 项 ， 第 三 项 等 等 。 我 们 还 可 以 引 
用 列表 的 开头 (第 一 个 项 ) 或 列表 的 结尾 (最 后 一 个 项 ) 。 为 了 简单 起 见 ， 我 们 假设 列表 不 
能 包含 重复 项 。 

例如 ， 整 数 54,26,93,17,77 和 31 的 集合 可 以 表示 考试 分 数 的 简单 无 序列 表 。 请 注意 ， 我 
们 将 它们 用 吉 号 分 隔 ， 这 是 列表 结构 的 常用 方式 。 当 然 ，Python 会 显示 这 个 列表 为 


[54,26,93,17,77,31] ° 


3.20. 无 友 列 表 抽 象 数据 类 型 


如 上 所 述 ， 无 序列 表 的 结构 是 项 的 集合 ， 其 中 每 个 项 保持 相对 于 其 他 项 的 相对 位 置 。 下 面 给 
出 了 一 些 可 能 的 无 序列 表 操 作 。 


List() 创建 一 个 新 的 空 列 表 。 它 不 需要 参数 ， 并 返回 一 个 空 列表 。 

add(item) 向 列表 中 添加 一 个 新 项 。 它 需要 item 作为 参数 ， 并 不 返回 任何 内 容 。 假 定 该 
item 不 在 列表 中 。 

remove(item) 从 列表 中 删除 该 项 。 它 需要 item 作为 参数 并 修改 列表 。 假 设 项 存在 于 列表 
中 。 

search(item) 搜索 列表 中 的 项 目 。 它 需要 item 作为 参数 ， 并 返回 一 个 布尔 值 。 

isEmpty() 检查 列表 是 否 为 室 。 它 不 需要 参数 ， 并 返回 布尔 值 。 

size () 返回 列表 中 的 项 数 。 它 不 需要 参数 ， 并 返回 一 个 整数 。 

append(item) 将 一 个 新 项 添加 到 列表 的 末尾 ， 使 其 成 为 集合 中 的 最 后 一 项 。 它 需要 item 
作为 参数 ， 并 不 返回 任何 内 容 。 假 定 该 项 不 在 列表 中 。 

index(item) 返回 项 在 列表 中 的 位 置 。 它 需要 item 作为 参数 并 返回 索引 。 假 定 该 项 在 列表 
中 。 

insert(pos，item) 在 位 置 pos 处 向 列表 中 添加 一 个 新 项 。 它 需要 item 作为 参数 并 不 返回 
任何 内 容 。 假 设 该 项 不 在 列表 中 ， 并 且 有 足够 的 现 有 项 使 其 有 pos 的 位 置 。 

pop() 删除 并 返回 列表 中 的 最 后 一 个 项 。 假 设 该 列表 至 少 有 一 个 项 。 

pop(pos) 删除 并 返回 位 置 pos 处 的 项 。 它 需要 pos 作为 参数 并 返回 项 。 假 定 该 项 在 列表 
中 。 


3.21. 实 现 无 序列 表 : 链表 


为 了 实现 无 序列 表 ， 我 们 将 构造 通常 所 知 的 链表 。 回 想 一 下 ， 我 们 需要 确保 我 们 可 以 保持 项 
的 相对 定位 。 然 而 ， 没 有 要 求 我 们 维持 在 连续 存储 器 中 的 定位 。 例 如 ， 考 虑 Figure 1 中 所 示 
的 项 的 集合 。 看 来 这 些 值 已 被 随机 放置 。 如 果 我 们 可 以 在 每 个 项 中 保持 一 些 明确 的 信息 ， 即 
下 一 个 项 的 位 置 (参见 Figure 2) ， 则 每 个 项 的 相对 位 置 可 以 通过 简单 地 从 一 个 项 到 下 一 个 
项 的 链接 来 表示 。 


17 
31 
26 
54 
77 
93 
Figure 1 
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31 (End) 
26 
Head 
54 
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要 注意 ， 必 须 明确 地 指定 链表 的 第 一 项 的 位 置 。 一 旦 我 们 知道 第 一 个 项 在 哪里 ， 第 一 个 项 目 
可 以 告诉 我 们 第 二 个 是 什么 ， 等 等 。 外 部 引用 通常 被 称 为 链表 的 头 。 类 似 地 ， 最 后 一 个 项 需 
要 知道 没有 下 一 个 项 。 


3.21.1.Node 类 


链表 实现 的 基本 构造 块 是 节点 。 每 个 节点 对 象 必 须 至 少 保存 两 个 信息 。 首 先 ， 节 点 必须 包含 
列表 项 本 身 。 我 们 将 这 个 称 为 节点 的 数据 字段 。 此 外 ， 每 个 节点 必须 保存 对 下 一 个 节点 的 引 
用 。 Listing 1 展示 了 Python 实现 。 要 构造 一 个 节点 ， 需 要 提供 该 节点 的 初始 数据 值 。 下 面 


的 赋值 语句 将 产生 一 个 包含 值 93 的 节点 对 象 ( 见 Figure 3) 。 应 该 注意 ， 我 们 通常 会 如 
Figure 4 所 示 表 示 一 个 节点 对 象 。Node 类 还 包括 访问 ， 修 改 数据 和 访问 下 一 个 引用 的 常用 方 
法 。 


class Node: 
def ipie Nse lm anwtdaca))|: 
self.data = initdata 
self.next = None 


def getData(self): 
return self.data 


def getNext(self): 
return self.next 


def setData(self, newdata): 
self.data = newdata 


def setNext(self,newnext): 
self.next = newnext 


Listing 1 


我 们 创建 一 个 Node 对 象 


>>> temp = Node(93) 
>>> temp.getData() 
93 


Python 引用 值 None 将 在 Node 类 和 链表 本 身 发 挥 重要 作用 。 引 用 None 代表 没有 下 一 个 节 
点 。 请 注意 在 构造 函数 中 ， 最 初创 建 的 节点 next 被 设置 为 None。 有 时 这 被 称 为 ”接地 节点 ， 
因此 我 们 使 用 标准 接地 符号 表示 对 None 的 引用 。 将 None 显 式 的 分 配给 初始 下 一 个 引用 值 是 
个 好 主意 。 





Figure 3 


temp 一 一 时 93 [}—>|| 


Figure 4 


3.21.2.Unordered List 类 


如 上 所 述 ， 无 序列 表 将 从 一 组 节点 构建 ， 每 个 节点 通过 显 式 引 用 链接 到 下 一 个 节点 。 只 要 我 
们 知道 在 哪里 找到 第 一 个 节点 (包含 第 一 个 项 ) ， 之 后 的 每 个 项 可 以 通过 连续 跟随 下 一 个 链 
接 找到 。 考 虑 到 这 一 点 ，UnorderedList 类 必须 保持 对 第 一 个 节点 的 引用 。Listing 2 显示 了 构 
造 函 数 。 注 意 ， 每 个 链表 对 象 将 维护 对 链表 头 部 的 单个 引用 。 


class UnorderedList: 
def __init__(self): 
self.head = None 
Listing 2 
我 们 构建 一 个 空 的 链表 。 赋 值 语 多 


>>> mylist = UnorderedList() 


创建 如 Figure 5 所 示 的 链表 。 正 如 我 们 在 Node 类 中 讨论 的 ， 特 殊 引 用 None 将 再 次 用 于 表 
示 链 表 的 头 部 不 引用 任何 内 容 。 最 终 ， 先 前 给 出 的 示例 列表 如 Figure 6 所 示 的 链接 列表 表 

示 。 链 表 的 头 指 代 列 表 的 第 一 项 的 第 一 节点 。 反 过 来 ， 该 节点 保存 对 下 一 个 节点 (下 一 个 

项 ) 的 引用 ， 等 等 。 重 要 的 是 注意 链表 类 本 身 不 包含 任何 节点 对 象 。 相 反 ， 它 只 包含 对 链接 
结构 中 第 一 个 节点 的 单个 引用 。 





Figure 5 
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Figure 6 


Listing 3 中 所 示 的 isEmpty 方法 只 是 检查 链表 头 是 否 是 None 的 引用 。 布尔 表达 式 self.head 
== None 的 结果 只 有 在 链表 中 没有 节点 时 才 为 由 。 由 于 新 链表 为 空 ， 因 此 构造 函数 和 空 检查 
必须 彼此 一 致 。 这 显示 了 使 用 引用 None 来 表示 链接 结构 的 end 的 优点 。 在 Python 中 ， 
None 可 以 与 任何 引用 进行 比较 。 如 果 它 们 都 指向 相同 的 对 象 ， 则 两 个 引用 是 相等 的 。 我 们 将 
在 其 他 方法 中 经 常 使 用 它 。 


def isEmpty(self): 
return self.head == None 


Listing 3 


那么 ， 我 们 如 何 将 项 加 入 我 们 的 链表 ? 我 们 需要 实现 add 方法 。 然 而 ， 在 我 们 做 这 一 点 之 
前 ， 我 们 需要 解决 在 链表 中 哪个 位 置 放置 新 项 的 重要 问题 。 由 于 该 链表 是 无 序 的 ， 所 以 新 项 
相对 于 已 经 在 列表 中 的 其 他 项 的 特定 位 置 并 不 重要 。 新 项 可 以 在 任何 位 置 。 考 虑 到 这 一 点 ， 
将 新 项 放 在 最 简单 的 位 置 是 有 意义 的 。 


回想 一 下 ， 链 表 结 构 只 为 我 们 提供 了 一 个 入 口 点 ， 即 链表 的 头 部 。 所 有 其 他 节点 只 能 通过 访 
问 第 一 个 节点 ， 然 后 跟随 下 一 个 链接 到 达 。 这 意味 着 添加 新 节点 的 最 简单 的 地 方 就 在 链表 的 
头 部 。 换 和 句 话说 ， 我 们 将 新 项 作为 链表 的 第 一 项 ， 现 有 项 将 需要 链接 到 这 个 新 项 后 。 


Figure 6 展示 了 链表 调用 多 次 add 函数 的 操作 


>>> mylist.add(31) 
>>> mylist.add(77) 
>>> mylist.add(17) 
>>> mylist.add(93) 
>>> mylist.add(26) 
>>> mylist.add(54) 


Figure 6 


AA 31 是 添加 到 链表 的 第 一 个 项 ， 它 最 终 将 是 链表 中 的 最 后 一 个 节点 ， 因 为 每 个 其 他 项 在 其 
前 面 添加 。 此 外 ， 由 于 54 是 添加 的 最 后 一 项 ， 它 将 成 为 链表 的 第 一 个 节点 中 的 数据 值 。 


add 方法 如 Listing 4 所 示 。 链 表 的 每 项 必须 驻 留 在 节点 对 象 中 。 第 2 行 创建 一 个 新 节点 并 将 
该 项 作为 其 数据 。 现 在 我 们 必须 通过 将 新 节点 链接 到 现 有 结构 中 来 完成 该 过 程 。 这 需要 两 个 
步 又， 如 Figure 7 所 示 。 步 又 1〈 行 3) 更 改 新 节点 的 下 一 个 引用 以 引用 上 加 链表 的 第 一 个 节 
点 。 现 在 ， 链 表 的 其 余部 分 已 经 正确 地 附加 到 新 节点 ， 我 们 可 以 修改 链表 的 头 以 引用 新 节 

点 。 第 4 行 中 的 赋值 语句 设置 列表 的 头 。 


上 述 两 个 步骤 的 顺序 非常 重要 。 如 果 第 3 行 和 第 4 行 的 顺序 颠倒 ， 会 发 生 什 么 ? 如 果 链 表 头 
部 的 修改 首先 发 生 ， 则 结果 可 以 在 Figure 8 中 看 到 。 由 于 head 是 链表 节点 的 唯一 外 部 引 
用 ， 所 有 原始 节点 都 将 丢失 并 且 不 能 再 被 访问 。 


def add(self,item): 
temp = Node(item) 
temp.setNext(self.head) 
self.head = temp 











Listing 4 
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我 们 将 实现 的 下 面 的 方法 - size ， search 和 remove -都 基于 一 种 称 为 链表 遍历 的 技术 。 
遍历 是 指 系统 地 访问 每 个 节点 的 过 程 。 为 此 ， 我 们 使 用 从 链表 中 第 一 个 节点 开始 的 外 部 引 
用 。 当 我 们 访问 每 个 节点 时 ， 我 们 通过 “遍历 "下 一 个 引用 来 移动 到 对 下 一 个 节点 的 引用 。 


要 实现 size 方法 ， 我 们 需要 遍历 链表 并 对 节点 数 计 数 。Listing 5 展示 了 用 于 计算 列表 中 节 
点 数 的 Python 代码 。 外 部 引用 称 为 current ， 并 在 第 二 行 被 初始 化 到 链表 的 头 部 。 开 始 的 

时 候 ， 我 们 没有 看 到 任何 节点 ， 所 以 计数 设置 为 0。 第 4-6 行 实际 上 实现 了 遍历 。 只 要 当前 
引用 没 到 链表 的 结束 位 置 (None) ， 我 们 通过 第 6 行 中 的 赋值 语句 将 当前 元 素 移 动 到 下 一 个 
节点 。 再 次 ， 将 引用 与 None 进行 比较 的 能 力 是 非常 有 用 的 。 每 当 current 移动 到 一 个 新 的 
节点 ， 我 们 加 1 以 计数 。 最 后 ， count 在 迭代 停止 后 返回 。Figure 9 展示 了 处 理 这 个 链表 的 
过 程 。 


def saze((selt ji: 
current = self.head 
count = 0 
while current != None: 
count = count + 1 
current = current.getNext() 


return count 


Listing 5 


current ‘Urrent ‘Urrent current “Urrent ‘Urrent current 





Figure 9 


在 链表 中 搜索 也 使 用 遍历 技术 。 当 我 们 访问 链表 中 的 每 个 节点 时 ， 我 们 将 询问 存储 在 其 中 的 
yan 与 我 们 正在 寻找 的 项 匹配 。 然 而 ， 在 这 种 情况 下 ， 我 们 不 必 一 直 遍 历 到 列表 的 末 

。 事 实 上 ， 如 果 我 们 到 达 链 表 的 末尾 ， 这 意味 着 我 们 正在 寻找 的 项 不 存在 。 此 外 ， 如 果 我 
项 ， 没 有 必要 继续 。 


Listing 6 展示 了 搜索 方法 的 实现 。 和 在 size 方法 中 一 样 ， 遍 历 从 列表 的 头 部 开始 初始 化 

(472) 。 我 们 还 使 用 一 个 布尔 变量 叫 found ， 标 记 我 们 是 否 找到 了 正在 寻找 的 项 。 因 为 我 
们 还 没有 在 遍历 开始 时 找到 该 项 ， found 设置 为 False (第 3 行 ) 。 第 4 行 中 的 迭代 考虑 了 上 
述 两 个 条 件 。 只 要 有 更 多 的 节点 访问 ， 而 且 我 们 没有 找到 正在 寻找 的 项 ， 我 们 就 继续 检查 下 
一 个 节点 。 第 5 行 检 查 数据 项 是 否 存在 于 当前 节点 中 。 如 果 存 在 ， found 设置 为 True 。 


def search(self,item): 
current = self.head 
found = False 
while current != None and not found: 
if current.getData() == item: 
found = True 
else: 
current = current.getNext() 


return found 


Listing 6 


作为 一 个 例子 ， 试 试 调用 search 方法 来 查找 item 17 


>>> mylist.search(17) 
True 


因为 17 在 列表 中 ， 所 以 遍历 过 程 需要 移动 到 包含 17 的 节点 。 此 时 ， found 变量 设置 为 
True > while 条 件 将 失败 ， 返 回 值 。 这 个 过 程 可 以 在 Figure 10 中 看 到 。 





Figure 10 


remove 方法 需要 两 个 逻辑 步 又。 首先 ， 我 们 需要 遍历 列表 寻找 我 们 要 删除 的 项 。 一 旦 我 们 找 
到 该 项 (我 们 假设 它 存在 ) ， 删 除 它 。 第 一 步 非常 类 似 于 搜索 。 从 设置 到 链表 头 部 的 外 部 引 
用 开始 ， 我 们 遍历 链接 ， 直 到 我 们 发 现 正在 寻找 的 项 。 因 为 我 们 假设 项 存在 ， 我 们 知道 迭代 
将 在 current BA None 之 前 停止 。 这 意味 着 我 们 可 以 简单 地 使 用 found 布尔 值 。 


当 found ŽA True It > current 将 是 对 包含 要 删除 的 项 的 节点 的 引用 。 但 是 我 们 如 何 删除 
Z? 一 种 方法 是 用 标示 该 项 目 不 再 存在 的 某 个 标记 来 替换 项 目的 值 。 这 种 方法 的 问题 是 节点 
数量 将 不 再 匹配 项 数量 。 最 好 通过 删除 整个 节点 来 删除 该 项 。 


为 了 删除 包含 项 的 节点 ， 我 们 需要 修改 上 一 个 节点 中 的 链接 ， 以 便 它 指向 当前 之 后 的 节点 。 
不 幸 的 是 ， 链 表 遍 历 没 法 回 退 。 因 为 ”current 指 我 们 想 要 进行 改变 的 节点 之 前 的 节点 ， 所 以 
进行 修改 太 巡 了。 


这 个 困境 的 解决 方案 是 在 我 们 遍历 链表 时 使 用 两 个 外 部 引用 。 current 将 像 之 前 一 样 工作 ， 
标记 遍历 的 当前 位 置 。 新 的 引用 ， 我 们 叫 previous ， 将 总 是 传递 current 后 面 的 一 个 节点 
。 这 样 ， 当 current 停止 在 要 被 去 除 的 节点 时 ， previous 将 引用 链表 中 用 于 修改 的 位 置 。 


Listing 7 展示 了 完整 的 remove 方法。 第 2-3 行 给 这 两 个 引用 赋 初 始 值 。 注 意 ， current 在 
链表 头 处 开始 ， 和 在 其 他 遍历 示例 中 一 样 。 然 而 ， previous 假定 总 是 在 current 之 后 一 个 
节点 。 因 此 ， 由 于 在 previous 之 前 没有 节点 ， 所 以 之 前 的 值 将 为 None (Jt Figure 

11) 。 found 的 布尔 变量 将 再 次 用 于 控制 迭代 © 


在 第 6-7 行 中 ， 我 们 检查 存储 在 当前 节点 中 的 项 是 否 是 我 们 希望 删除 的 项 。 如 果 是 ， Found 
设置 为 True 。 如 果 我 们 没有 找到 该 项 ， 则 previous 和 current 都 必须 向 前 移动 一 个 节 
点 。 同 样 ， 这 两 个 语句 的 顺序 是 至 关 重 要 的 。 previous 必须 先 将 一 个 节点 移动 到 current 


的 位 置 。 此 时 ， 才 可 以 移动 current 。 这 个 过 程 通常 被 称 为 “英寸 蠕动 "， 因 为 ”previous 必须 
赶 上 current ， 然 后 current 前 进 。Figure 12 展示 了 previous 和 current 的 移动 ， 它 们 
沿 着 链表 向 下 移动 ， 了 寻找 包含 值 17 的 节点 。 


def remove(self,item): 
current = self.head 
previous = None 
found = False 
while not found: 
if current.getData() == item: 
found = True 
else: 
previous = current 
current = current.getNext() 


if previous == None: 
self.head = current.getNext() 


elise: 
previous.setNext(current.getNext()) 


Listing 7 
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Figure 11 


3.21. 实 现 无 序列 表 : 链 ; 
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Figure 12 


一 旦 remove 的 搜索 步骤 已 经 完成 ， 我 们 需要 从 链表 中 删除 该 节点 。 Figure 13 展示 了 要 修改 
的 链接 。 但 是 ， 有 一 个 特殊 情况 需要 解决 。 如 果 要 删除 的 项 目 恰好 是 链表 中 的 第 一 个 项 ， 则 
current 将 引用 链接 列表 中 的 第 一 个 节点 。 这 也 意味 着 previous 是 None。 我 们 先前 说 

过 ， previous 是 一 个 节点 ， 它 的 下 一 个 节点 需要 修改 。 在 这 种 情况 下 ， 不 是 previous ， 而 
是 链表 的 head 需要 改变 ( 见 Figure 14) ° 


previous current 





Figure 13 
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Figure 14 


第 12 行 检查 是 否 处 理 上 述 的 特殊 情况 。 如 果 previous RAHA? 4 found 的 布尔 变 为 
True 时 ， 它 仍 是 None。 在 这 种 情况 下 (4713) ， 链 表 的 head 被 修改 以 指 代 当前 节点 之 后 
的 节点 ， 实 际 上 是 从 链表 中 移 除 第 一 节点 。 但 是 ， 如 果 previous 不 为 None， 则 要 删除 的 
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节点 位 于 链表 结构 的 下 方 。 在 这 种 情况 下 ， previous 的 引用 为 我 们 提供 了 下 一 个 引用 更 改 
的 节点 。 第 15 行使 用 之 前 的 ”setNext 方法 完成 删除 。 注 意 ， 在 这 两 种 情况 下 ， 引 用 更 改 的 
目标 是 current.getNext() ° 经 常 ee ， 这 里 给 出 的 两 种 情况 是 否 也 将 处 理 要 
移 除 的 项 在 链表 的 最 后 节点 中 的 情况 。 我 们 留 给 你 ° 


3.22. 有 序列 表 抽 象 数据 结 


我 们 现在 将 考虑 一 种 称 为 有 序列 表 的 列表 类 型 。 例 如 ， 如 果 上 面 所 示 的 整数 列表 是 有 序列 表 
(升序 ) ， 则 它 可 以 写 为 17,26,31,54,77 和 93 。 由 于 17 是 最 小 项 ， 它 占据 第 一 位 置 。 同 样 ， 
由 于 93 是 最 大 的 ， 它 占据 最 后 的 位 置 。 


有 序列 表 的 结构 是 项 的 集合 ， 其 中 每 个 项 保存 基于 项 的 一 些 潜在 特性 的 相对 位 置 。 排 序 通 常 
是 升序 或 降序 ， 并 且 我 们 假设 列表 项 具有 已 经 定义 的 有 意义 的 比较 运算 。 许 多 有 序列 表 操 作 
与 无 序列 表 的 操作 相同 。 


OrderedList() 创建 一 个 新 的 空 列 表 。 它 不 需要 参数 ， 并 返回 一 个 空 列表 。 

add(item) 向 列表 中 添加 一 个 新 项 。 它 需要 tem 作为 参数 ， 并 不 返回 任何 内 容 。 假 定 该 
item 不 在 列表 中 。 

remove(item) 从 列表 中 删除 该 项 。 它 需要 item 作为 参数 并 修改 列表 。 假 设 项 存在 于 列表 
中 。 

search(item) 搜索 列表 中 的 项 目 。 它 需要 item 作为 参数 ， 并 返回 一 个 布尔 值 。 

isEmpty) 检查 列表 是 否 为 室 。 它 不 需要 参数 ， 并 返回 布尔 值 。 

size () 返回 列表 中 的 项 数 。 它 不 需要 参数 ， 并 返回 一 个 整数 。 

index(item) 返回 项 在 列表 中 的 位 置 。 它 需要 item 作为 参数 并 返回 索引 。 假 定 该 项 在 列表 
中 。 

pop() 删除 并 返回 列表 中 的 最 后 一 个 项 。 假 设 该 列表 至 少 有 一 个 项 。 

pop(pos) 删除 并 返回 位 置 pos 处 的 项 。 它 需要 pos 作为 参数 并 返回 项 。 假 定 该 项 在 列表 
中 。 


3.23. 实 现 有 序列 表 


为 了 实现 有 序列 表 ， 我 们 必须 记 住 项 的 相对 位 置 是 基于 一 些 潜在 的 特性 。 上 面 给 出 的 整数 的 
有 序列 表 17,26,31,54,77 和 93 可 以 由 Figure 15 所 示 的 链接 结构 表示 。 节 点 和 链接 结构 表 
示 项 的 相对 位 置 。 





Figure 15 


为 了 实现 OrderedList 类 ， 我 们 将 使 用 与 前 面 看 到 的 无 序列 表 相 同 的 技术 。 再 次 ， head 的 引 
用 为 None 表示 为 空 链表 (KM Listing 8) ° 


class OrderedList: 
def __init__(self): 
self.head = None 


Listing 8 


当 我 们 考虑 有 序列 表 的 操作 时 ， 我 们 应 该 注意 ，isEmpty size 方法 可 以 与 无 序列 表 一 样 
实现 ， 因 为 它们 只 处 理 链表 中 的 节点 数量 ， 而 不 考虑 实际 项 值 。 同 样 ， remove 方法 将 正常 工 
作 ， 因 为 我 们 仍然 需要 找到 该 项 ， 然 后 删除 它 。 剩 下 的 两 个 方法 ， search 和 add ， 将 需要 
一 些 修改 。 


搜索 无 序列 表 需 要 我 们 一 次 遍历 一 个 节点 ， 直 到 找到 我 们 正在 寻找 的 节点 或 者 没 找到 节点 
(None) 。 事 实证 明 ， 相 同 的 方法 在 有 序列 表 也 有 效 。 然 而 ， 在 项 不 在 链表 中 的 情况 下 ， 我 
们 可 以 利用 该 顺序 来 尽快 停止 搜索 。 


例如 ，Figure 16 展示 了 有 序 链 表 搜 索 值 45 。 从 链表 的 头 部 开始 遍历 ， 首 先 与 17 进行 比 
较 。 由 于 17 不 是 我 们 正在 寻找 的 项 ， 移 动 到 下 一 个 节点 26 。 再 次 ， 这 不 是 我 们 想 要 的 ， 
继续 到 31 ， 然 后 再 到 54 。 在 这 一 点 上 ， 有 一 些 不 同 。 由 于 54 不 是 我 们 正在 寻找 的 项 ， 
我 们 以 前 的 方法 是 继续 向 前 迭代 。 然 而 ， 由 于 这 是 有 序列 表 ， 一 旦 节点 中 的 值 变 得 大 于 我 们 
正在 搜索 的 项 ， 搜 索 就 可 以 停止 并 返回 False 。 该 项 不 可 能 存在 于 后 面 的 链表 中 。 





Figure 16 


Listing 9 展示 了 完整 的 搜索 方法 。 通 过 添加 另 一 个 布尔 变量 stop 并 将 其 初始 化 为 

False (第 4 行 ) ， 很 容易 合并 上 述 新 条 件 。 当 stop 是 False (不 停止 ) 时 ， 我 们 可 以 继 
续 在 列表 中 前 进 〈 第 5 行 ) 。 如 果 发 现任 何 节点 包含 大 于 我 们 正在 寻找 的 项 的 数据 ， 我 们 将 
stop 设置 为 True (第 9-10 行 ) 。 其 余 行 与 无 序列 表 搜 索 相 同 。 


def search(self,item): 
current = self.head 
found = False 
stop = False 
while current != None and not found and not stop: 
if current.getData() == item: 
found = True 
else: 
if current.getData() > item: 
stop = True 
else: 
current = current.getNext() 


return found 


Listing 9 


最 重要 的 需要 修改 的 方法 是 add 。 回想 一 下 ， 对 于 无 序列 表 ， add 方法 可 以 简单 地 将 新 节 
点 放置 在 链表 的 头 部 。 这 是 最 简单 的 访问 点 。 不 幸 的 是 ， 这 将 不 再 适用 于 有 序列 表 。 需 要 在 
现 有 的 有 序列 表 中 查找 新 项 所 属 的 特定 位 置 。 


假设 我 们 有 由 17,26,54,77 和 93 组 成 的 有 序列 表 ， 并 且 我 们 要 添加 值 31 ° add 方法 必 
须 确 定 新 项 属于 26 到 54 之 间 。Figure 17 展示 了 我 们 需要 的 设置 。 正 如 我 们 前 面 解释 
的 ， 我 们 需要 遍历 链表 ， 寻 找 添加 新 节点 的 地 方 。 我 们 知道 ， 当 我 们 和 迭代 完 节 点 ( current 
变 为 None) 或 current 节点 的 值 变 得 大 于 我 们 希望 添加 的 项 时 ， 我 们 就 找到 了 该 位 置 。 在 
我 们 的 例子 中 ， 看 到 值 54 我 们 停止 迭代 。 


previous current 


head 





Figure 17 


正如 我 们 看 到 的 无 序列 表 ， 有 必要 有 一 个 额外 的 引用 ， 再 次 称 为 previous ， 因 为 current 
不 会 提供 对 修改 的 节点 的 访问 。Listing 10 展示 了 完整 的 add 方法 。 行 2-3 设置 两 个 外 部 引 
用 ， 行 9-10 允许 previous 每 次 通过 过 失 代 跟随 current 节点 后 面 。 条件 (475) 允许 迭代 
继续 ， 只 要 有 更 多 的 节点 ， 并 且 当 前 节点 中 的 值 不 大 于 该 项 。 在任 一 种 情况 下 ， 当 和 迭代 失败 
时 ， 我 们 找到 了 新 节点 的 位 置 。 


该 方法 的 其 余部 分 完成 Figure17 所 示 的 两 步 过 程 。 一 旦 为 该 项 创建 了 新 节点 ， 剩 下 的 唯一 问 
题 是 新 节 P 点 是 否 将 被 添加 在 链表 的 开始 处 或 某 个 中 间 人 位置。 再 次 ， previous == None (第 13 
行 ) 可 以 用 来 提供 答案 。 


def add(self,item): 
current = self.head 
previous = None 
stop = False 
while current != None and not stop: 
if current.getData() > item: 
stop = True 
else: 
previous = current 
current = current.getNext() 


temp = Node(item) 

if previous == None: 
temp.setNext(self.head) 
self.head = temp 

else: 
temp. setNext (current) 
previous .setNext (temp) 


Listing 10 


3.23.1. 链 表 分 析 


为 了 分 析 链 表 操作 的 复杂 性 ， 我 们 需要 考虑 它们 是 否 需要 遍历 。 考 虑 具有 n 个 节点 的 链表 。 
isEmpty 方法 是 O(1) >? 因为 它 需 要 一 个 步骤 来 检查 头 的 引用 为 ”None 。 另 一 方面 ， size 将 
总 是 需要 mn 个 步骤 ， 因 为 不 从 头 到 尾 地 移动 没 法 知道 有 多 少 节点 在 链表 中 。 因 此 ， 长 度 为 

O(n)。 将 项 添加 到 无 序列 表 始终 是 DO(1)， 因 为 我 们 只 是 将 新 节点 放置 在 链表 的 头 部 。 但 是 ， 
搜索 和 删除 ， 以 及 添加 有 序列 表 ， 都 需要 遍历 过 程 。 虽 然 平均 他 们 可 能 只 需要 遍历 节点 的 一 
半 ， 这 些 方法 都 是 O(n)， 因 为 在 最 坏 的 情况 下 ， 都 将 处 理 列表 中 的 每 个 节点 。 


你 可 能 还 注意 到 此 实现 的 性 能 与 早 前 针对 Python 列表 给 出 的 实际 性 能 不 同 。 这 表明 链表 不 是 
Python 列表 的 实现 方式 。 Python 列表 的 实际 实现 基于 数组 的 概念 。 我 们 在 第 8 章 中 更 详细 
地 讨论 这 个 问题 。 


3.23. 实 现 有 序列 表 
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3.24. X 


° 的 性 数据 结构 以 有 序 的 方式 保存 它们 的 数据 。 

© 栈 是 维持 LIFO， 后 进 先 出 ， 排 序 的 简单 数据 结构 。 

e a push ， pop 和 isEmpty ° 

© 队列 是 维护 FIFO〈 先 进 先 出 ) 排序 的 简单 数据 结构 。 

e 队列 的 基本 操作 是 enqueue °’ dequeue 和 isEmpty ° 

。 前 级 ， 中 级 和 后 级 都 是 写 表 达 式 的 方法 。 

© 栈 对 于 设计 计算 解析 表达 式 算 法 非常 有 用 。 

© 栈 可 以 提供 反 转 特性 。 

。 队列 可 以 帮助 构建 定时 仿真 。 

© 模拟 使 用 随机 数 生 成 器 来 创建 真实 情况 ， 并 帮助 我 们 回答 “假设 "类 型 的 问题 。 

© Deques 是 允许 类 似 栈 和 队列 的 混合 行为 的 数据 结构 。 

e deque 的 基本 操作 是 addFront ， addRear °’ removeFront ， removeRear 和 
isEmpty ° 

。 列表 是 项 的 集合 ， 其 中 每 个 项 目 保存 相对 位 置 。 

。 链表 实现 保持 逻辑 顺序 ， 而 不 需要 物理 存储 要 求 。 

© 修改 链表 头 是 一 种 特殊 情况 。 


4. 递 只 
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4.1. 目 标 


本 章 的 目标 如 下 : 


要 理解 可 能 难以 解决 的 复杂 问题 有 一 个 简单 的 递归 解决 方案 。 
学 习 如 何 递归 地 写 出 程序 。 

理解 和 应 用 递归 的 三 个 定律 。 

将 递归 理解 为 一 种 迭代 形式 。 

实现 问题 的 递归 公式 化 。 

了 解 计算 机 系统 如 何 实现 递归 。 


4.2. 什 么 是 递归 


递归 是 一 种 解决 问题 的 方法 ， 将 问题 分 解 为 更 小 的 子 问题 ， 直 到 得 到 一 个 足够 小 的 问题 可 以 
被 很 简单 的 解决 。 通 常 递归 涉及 函数 调用 自身 。 递 归 允 许 我 们 编写 优雅 的 解决 方案 ， 解 决 可 
能 很 难 编程 的 问题 。 


4.3. 计 算 整数 列表 和 


我 们 将 以 一 个 简单 的 问题 开始 ， 你 已 经 知道 如 何不 使 用 递归 解决 。 假 设 你 想 计 算 整 数列 表 的 
总 和 ， 例 如 > [1,3,5,7,9] 。 计算 总 和 的 迭代 函数 见 ActiveCode 1。 函 数 使 用 累加 器 变量 
( thesum ) 来 计算 列表 中 所 有 整数 的 和 ， 从 0 开始 ， 加 上 列表 中 的 每 个 数字 。 


def listsum(numList): 
theSum = 0 
for i in numList: 
theSum = theSum + i 
return theSum 


print(listsum([1,3,5,7,9])) 


Activecode 1 


假设 没有 while 循环 或 for 循环 。 你 将 如 何 计 算 整 数列 表 的 总 和 ? 如 果 你 是 一 个 数学 家 ， 
你 可 能 开始 回忆 加 法 是 一 个 函数 ， 这 个 函数 定义 了 两 个 整数 类 型 的 参数 。 故 将 列表 和 问题 从 
加 一 个 列表 重新 定义 为 加 一 对 整数 ， 我 们 可 以 把 列表 重 写 为 一 个 完全 括号 表达 式 。 如 下 所 


Ti 


((((1 +3)+5)+7)+9) 


我 们 也 可 以 把 表达 式 用 另 一 种 方式 括 起 来 
(1+(3+(5+(7+9)))) 


注意 ， 最 内 层 的 括号 (7+9) 我 们 可 以 没有 循环 或 任何 特殊 的 结构 来 解决 它 。 事实 上 ， 我 们 
可 以 使 用 以 下 的 简化 序列 来 计算 最 终 的 和 。 


total = (1+(3+(5+( 十 9)))) 
total = (1+ (3+ (5+ 16))) 
total = (1+ (3+21)) 

total = (1 + 24) 

total = 25 


我 们 如 何 能 把 这 个 想法 变 成 一 个 Python 程序 ? 首先 ， 让 我 们 以 Python 列表 的 形式 重 述 求 和 
问题 。 我 们 可 以 说 列表 numList 的 和 是 列表 的 第 一 个 元 素 numList[0] 和 列表 其 余部 
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分 numList [1:] 之 和 的 总 和 。 以 函数 形式 表述 : 


listSum(numList) = first(numList) + listSum(rest(numList)) 


在 这 个 方程 式 中 ， first(numList) 返回 列表 的 第 一 个 元 素 ， rest(numList) 返回 除 第 一 个 元 
素 之 外 的 所 有 元 素 列 表 。 这 很 容易 在 Python 中 表示 ， 如 ActiveCode 2 中 所 示 。 


def listsum(numList): 
if len(numList) == 1: 
return numList[0] 
else: 
return numList[0] + listsum(numList[1:]) 


print(listsum([1,3,5,7,9])) 


Active code 2 


在 这 个 清单 中 有 几 个 关键 地 方 。 首先 ， 在 第 2 行 ， 我 们 检查 列表 是 否 为 一 个 元 素 。 检查 
是 至 关 重 要 的 ， 是 我 们 的 函数 的 转折 子 甸 。 长 度 为 1 的 列表 和 是 微不足道 的 ; epee: 
的 数字 。 第 二 ， 在 第 5 行 函 数 调用 自己 ! 这 就 是 我 们 称 listum 算法 递归 的 原因 。 递 归 函 数 是 
调用 自身 的 函数 。 


Figure 1 展示 了 对 列表 [1,3,5,7,9] 求 和 所 需 的 一 系列 递归 调用 。 你 应 该 把 这 一 系列 的 调用 
想象 成 一 系列 的 简化 。 每 次 我 们 进行 递归 调用 时 ， 我 们 都 会 解决 一 个 较 小 的 问题 ， 直 到 达到 


问题 不 能 减 小 的 程度 。 
M 






| w H>) 


Figure 1 


当 我 们 到 达 简 单 问题 的 点 ， 我 们 开始 拼凑 每 个 小 问题 的 答案 ， 直 到 初始 问题 解决 。Figure 2 
展示 了 在 listsum 通过 一 系 列 调用 返 回 的 过 T P Hh 行 的 add 操作 o 当 listsum 从 最 顶层 返 
回 时 ， 我 们 就 有 了 整个 问题 的 答案 。 


4.3. 计 算 整 数列 表 和 


[= 上- und3579 p= 
sum(3,5,7,9) = 
sum(5,7,9) 一 





Figure 2 
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4.4. 递 上 归 的 三 定律 


像 阿 西 英 夫 机 器 人 ， 所 有 递归 算法 必须 服从 三 个 重要 的 定律 : 


1. 递归 算法 必须 具有 基本 情况 。 
2. 递归 算法 必须 改变 其 状态 并 向 基本 情况 靠近 。 
3. 递归 算法 必须 以 递归 方式 调用 自身 。 


让 我 们 更 详细 地 看 看 每 一 个 定律 ， 看 看 它 如 何在 listsum 算法 中 使 用 。 首 先 ， 基 本 情况 是 算 
法 停止 递归 的 条 件 。 基 本 情况 通常 是 足够 小 以 直接 求解 的 问题 。 在 listsum 算法 中 ， 基 本 情 
况 是 长 度 为 1 的 列表 。 


为 了 遵守 第 二 定律 ， 我 们 必须 将 算法 向 基本 情况 的 状态 改变 。 状 态 的 改变 意味 着 该 算法 正在 
使 用 的 一 些 数据 被 修改 。 通 常 ， 表 示 问 题 的 数据 在 某 种 程度 上 变 小 。 在 listsum 算法 中 ， 我 
们 的 主要 数据 结构 是 一 个 列表 ， 因 此 我 们 必须 将 我 们 的 状态 转换 工作 集中 在 列表 上 。 因 为 基 
本 情况 是 长 度 1 的 列表 ， 所 以 朝向 基本 情况 的 自然 进展 是 缩短 列表 。 在 Activecode 2 第 五 

行 ， 我 们 调用 listsum 生成 一 个 较 短 的 列表 。 


最 后 的 法 则 是 算法 必须 调用 自身 。 这 是 递归 的 定义 。 递 归 对 于 许多 新 手 程序 员 来 说 是 一 个 混 
乱 的 概念 。 作 为 一 个 新 手 程序 员 ， 你 已 经 知道 函数 是 有 益 的 ， 因 为 你 可 以 将 一 个 大 问题 分 解 
成 较 小 的 问题 。 较 小 的 问题 可 以 通过 编写 一 个 函数 来 解决 。 我 们 用 一 个 函数 解决 问题 ， 但 该 
函数 通过 调用 自己 解决 问题 ! 该 逻辑 不 是 循环 ;递归 的 逻辑 是 通过 将 问题 分 解 成 更 小 和 更 容易 
的 问题 来 解决 的 优雅 表达 。 


在 本 章 的 剩余 部 分 ， 我 们 将 讨论 更 多 递归 的 例子 。 在 每 种 情况 下 ， 我 们 将 集中 于 使 用 递归 的 
三 个 定律 来 设计 问题 的 解决 方案 。 


4.5. 整 数 转换 为 任意 进 制 字符 串 


假设 你 想 将 一 个 整数 转换 为 一 个 二 进 制 和 十 六 进 制 字符 串 。 例 如 ， 将 整数 16 转换 为 十 进 制 
字符 串 表 示 为 10 ， 或 将 其 字符 串 表 示 为 二 进 制 1010 。 虽 然 有 很 多 算法 来 解决 这 个 问题 ， 
包括 在 栈 部 分 讨论 的 算法 ， 但 递归 的 解决 方法 非常 优雅 。 


让 我 们 看 一 个 十 进 制 数 769 的 具体 示例 。 假 设 我 们 有 一 个 对 应 于 前 10 位 数 的 字符 序列 ， 
例如 convString ="0123456789” ° 通过 在 序列 中 查找 ， 很 容易 将 小 于 10 的 数字 转换 为 其 等 
效 的 字符 串 。 例 如 ， 如 果 数 字 为 9 ， 则 字符 串 为 convString[9] 或 “9”。 如 果 我 们 将 数字 

769 分 成 三 个 单个 位 数字 ，7 ，6 和 9 ， 那 么 将 其 转换 为 字符 串 很 简单 。 数 字 小 于 10 听 
起 来 像 一 个 好 的 基本 情况 。 


知道 我 们 的 基本 情况 是 什么 意味 着 整个 算法 将 分 成 三 个 部 分 : 


1， 将 原始 数字 减少 为 一 系列 单个 位 数字 。 
2 使 用 查找 将 单个 位 数字 数字 转换 为 字符 囊 。 
3， 将 单个 位 字符 囊 连接 在 一 起 以 形成 最 终结 果 。 


下 一 步 是 找到 改变 其 状态 的 方法 并 向 基本 情况 靠近 。 由 于 我 们 示例 为 整数 ， 所 以 考虑 什么 数 
学 运算 可 以 减少 一 个 数字 。 最 可 能 的 候选 是 除法 和 减法 。 虽 然 减法 可 能 可 以 实现 ， 但 我 们 不 
清楚 应 该 减 去 多 少 。 使 用 余数 的 整数 除法 为 我 们 提供 了 一 个 明确 的 方向 。 让 我 们 看 看 如 果 我 
们 将 一 个 数字 除 以 我 们 试图 转换 的 基数 ， 会 发 生 什 么 。 

使 用 整数 除法 将 769 RA 10 ， 我 们 得 到 76 ， 余 数 为 9。 这 给 了 我 们 两 个 好 的 结果 。 首 
先 ， 余 数 是 小 于 我 们 的 基数 的 数字 ， 可 以 通过 查找 立即 转换 为 字符 串 。 第 二 ， 我 们 得 到 的 商 
小 于 原始 数字 ， 并 让 我 们 靠近 具有 小 于 基数 的 单个 数字 的 基本 情况 。 现 在 我 们 的 工作 是 将 

76 转换 为 其 字符 串 表 示 。 再 次 ， 我 们 使 用 商 和 余数 分 别 获得 7 和 6 NAR RE? KM 
将 问题 减少 到 转换 7 ， 我 们 可 以 很 容易 地 做 到 ， 因 为 它 满足 n < base 的 基本 条 件 ， 其 中 
base = 10 。 我 们 刚刚 执行 的 一 系列 操作 如 Figure 3 所 示 。 请 注意 ， 余 数位 于 图 右 侧 框 中 。 
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Figure 3 
ActiveCode 1 展示 了 实现 上 述 算 法 的 Python 代码 ， 以 2 到 16 之 间 的 任何 基数 为 参数 。 
def toStr(n, base): 
convertString = "0123456789ABCDEF" 
if n < base: 
return convertString[n] 
else: 


return toStr(n//base, base) + convertString[n%base] 


print(toStr(1453,16)) 


请 注意 ， 在 第 3 行 中 ， 我 们 检查 基本 情况 ， 其 中 n 小 于 我 们 要 转换 的 基数 。 当 我 们 检测 到 基 
本 情况 时 ， 我 们 停止 递归 ， 并 简单 地 从 convertString 序列 返回 字符 串 。 在 第 6 行 中 ， 我 们 满 
足 第 二 和 第 三 定律 - 递归 调用 和 减少 除法 问题 大 小 。 


让 我 们 再 次 跟踪 算法 ; 这 次 我 们 将 数字 10 转换 为 其 基数 为 2 的 字符 串 (“1010”) © 
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Figure 4 


Figure 4 显示 我 们 得 到 的 结果 ， 但 看 起 来 数字 是 错误 的 顺序 。 该 算法 是 正确 的 ， 因 为 我 们 首 
先 在 第 6 行进 行 递归 调用 ， 然 后 我 们 添加 余数 的 字符 串 形式 。 如 果 我 们 反 向 返回 
convertString 查找 并 返回 toStr 调用 ， 则 生成 的 字符 串 将 是 反 向 的 | 通过 延 后 连接 操作 直到 递 
归 调 用 返回 ， 我 们 可 以 得 到 正确 顺序 的 结果 。 这 应 该 能 使 你 想起 你 在 上 一 章 中 讨论 的 栈 。 


4.6. 栈 帧 : 实现 递归 


假设 不 是 将 递归 调用 的 结果 与 来 自 convertString 的 字符 串 拼 接 到 toStr， 我 们 修改 了 算法 ， 以 
便 在 进行 递归 调用 之 前 将 字符 串 入 栈 。 此 修改 的 算法 的 代码 展示 在 ActiveCode 1 中。 


from pythonds.basic.stack import Stack 
rStack = Stack() 


def toStie(n, base): 
convertString = "0123456789ABCDEF" 
while n > 0: 
if n < base: 
rStack.push(convertString[n] ) 
else: 
rStack.push(convertString[n % base] ) 
n =n // base 
(res =. UN 
while not rStack.isEmpty(): 
res = res + str(rStack.pop()) 
return res 


print(toStr(1453,16)) 


ActiveCode 1 

每 次 我 们 调用 toStr， 我 们 在 栈 上 推 入 一 个 字符 。 回 到 前 面 的 例子 ， 我 们 可 以 看 到 在 第 四 次 调 
用 toStr 之 后 ， 栈 看 起 来 像 Figure 5。 注 意 ， 现 在 我 们 可 以 简单 地 将 字符 从 栈 中 弹出 ， 并 将 它 
们 连接 成 最 终结 果 “1010”。 





Figure 5 


前 面 的 例子 让 我 们 了 解 了 Python 如 何 实现 一 个 递归 函数 调用 。 当 在 Python FAA HAH >» 
会 分 配 一 个 栈 来 处 理 函 数 的 局 部 变量 。 当 函数 返回 时 ， 返 回 值 留 在 栈 的 顶部 ， 以 供 调用 函数 
访问 。 Figure 6 说 明了 第 4 行 返回 语 多 后 的 调用 栈 。 


toStr(2,2) 
n=2 
base = 2 


toStr(2//2,2) + convertString[2%2] 


toStr(5//2,2) + convertString[5%2] 
toStr(1@,2) 

n= 10 

base = 2 


toStr(1@//2,2) + convertString[10%2] 





Figure 6 


注意 ， 对 tostr(2//2,2) 的 调用 在 栈 上 返回 值 为 “1”。 然后 ， 在 表达 式 “1" + 
convertString[2%2] 中 使 用 此 返回 值 蔡 换 函 数 调 用 (tostr(1,2)) ， 这 将 在 栈 顶 部 留 下 字符 串 
“140” ° 这 样 ，Python 调用 栈 就 代替 了 我 们 在 Listing 4 中 明确 使 用 的 栈 。 在 我 们 的 列表 求 和 示 
例 中 ， 你 可 以 认为 栈 上 的 返回 值 取代 了 累加 器 变量 。 


栈 帧 还 为 芳 数 使 用 的 变量 提供 了 一 个 作用 域 。 即使 我 们 重复 地 调用 相同 的 函数 ， 每 次 调用 都 
会 为 函数 本 地 的 变量 创建 一 个 新 的 作用 域 。 


4.7. 介 绍 : 可 视 化 递归 


在 上 一 节 中 ， 我 们 讨论 了 一 些 使 用 递归 很 容易 解决 的 问题 ; 然而 ， 我 们 可 能 很 难 找 到 一 个 模型 
或 一 种 可 视 化 方法 知道 在 递归 函数 中 发 生 了 什么 。 这 使 得 递归 难以 让 人 掌握 。 在 本 节 中 ， 我 
们 将 看 到 几 个 使 用 递归 绘制 一 些 有 趣 图 片 的 例子 。 当 你 看 到 这 些 图 片 的 形状 ， 你 会 对 递归 过 
程 有 新 的 认识 ， 可 能 有 助 于 巩固 你 对 递归 理解 。 


我 们 使 用 的 插图 的 工具 是 Python 4 turtle 模块 称 为 turtle 。 turtle 是 Python 所 有 版 
本 的 标准 库 ， 并 且 非 常 易于 使 用 。 比 喻 很 简单 。 你 可 以 创建 一 只 乌龟 ， 乌 龟 能 前 进 ， 后 退 ， 
左 转 ， 右 转 等 。 和 乌龟 可 以 让 它 的 尾巴 或 上 或 下 。 当 乌龟 的 尾巴 向 下 ， 它 移动 时 会 画 一 条 线 。 
为 了 增加 乌龟 的 艺术 价值 ， 你 可 以 改变 尾巴 的 宽度 以 及 尾巴 浸入 的 墨水 的 颜色 。 


这 里 有 一 个 简单 的 例子 来 说 明 龟 图 形 基础 。 我 们 将 使 用 turtle 模块 递归 绘制 螺旋 。 见 
ActiveCode 1° 导入 turtle 模块 后 ， 我 们 创建 一 个 乌龟 。 当 乌龟 被 创建 时 ， 它 也 创建 一 个 
窗口 来 绘制 。 接 下 来 我 们 定义 drawspiral 了 有 函数 。 这 个 简单 函数 的 基本 情况 是 当 我 们 想 要 绘 
制 的 线 的 长 度 (由 len 参数 给 出 ) 减 小 到 零 或 更 小 时 。 如 果 线 的 长 度 大 于 零 ， 我 们 让 和 乌龟 以 
len 单位 前 进 ， 然 后 向 右 转 90 度 。 当 我 们 再 次 调用 drawSpiral 并 缩短 长 度 时 递归 。 在 
ActiveCode 1 结束 时 ， 你 会 注意 到 我 们 调用 函数 mywin.exitonclick() ， 这 是 一 个 方便 的 缩小 
窗口 的 方法 ， 使 乌龟 进入 等 待 模式 ， 直 到 你 单 击 窗口 ， 然 后 程序 清理 并 退出 。 


import turtle 


myTurtle = turtle.Turtle() 
myWin = turtle.Screen() 


def drawSpiral(myTurtle, lineLen): 
if lineLen > 0: 
myTurtle.forward(lineLen) 
myTurtle.right(90) 
drawSpiral(myTurtle, lineLen-5) 


drawSpiral(myTurtle, 100) 
myWin.exitonclick() 


这 是 关于 你 知道 的 所 有 龟 图 形 ， 以 制作 一 些 令 人 印象 深刻 的 涂鸦 。 我 们 的 下 一 个 程序 ， 将 绘 
制 一 个 分 形 树 。 分 形 来 自 数学 的 一 个 分 支 ， 并 且 与 递归 有 很 多 共同 之 处 。 分 形 的 定义 是 ， 当 
你 看 着 它 时 ， 无 论 你 放大 多 少 ， 分 形 有 相同 的 基本 形状 。 大 自然 的 一 些 例子 是 大 陆 的 海岸 
线 ， 雪 花 ， 山 脉 ， 甚 至 树木 或 灌木 。 这 些 自然 现象 中 的 许多 的 分 形 性 质 使 得 程序 员 能 够 为 计 
算 机 生成 的 电影 生成 非常 电 监 的 风景 。 在 我 们 的 下 一 个 例子 中 ， 将 生成 一 个 分 形 树 。 

要 理解 这 如 何 工 作 ， 需 要 想 一 想 如 何 使 用 分 形 词汇 来 描述 树 。 记 住 ， 我 们 上 面 说 过 ， 分 形 是 
在 所 有 不 同 的 放大 倍率 下 看 起 来 是 一 样 的 。 如 果 我 们 将 它 翻译 成 树木 和 灌木 ， 我 们 可 能 会 
说 ， 即 使 一 个 小 树枝 也 有 一 个 整体 树 的 相同 的 形状 和 特征 。 有 了 这 个 想法 ， 我 们 可 以 说 一 棵 


树 是 树干 ， 一 棵 较 小 的 树 向 右 走 ， 另 一 棵 较 小 的 树 向 左 走 。 如 果 你 用 递归 的 思想 考虑 这 个 定 
义 ， 这 意味 着 我 们 将 树 的 递归 定义 应 用 到 较 小 的 左 树 和 右 树 。 


让 我 们 把 这 个 想法 转换 成 一 些 Python 代码 。Listing 1 展示 了 如 何 使 用 我 们 的 乌龟 来 生成 分 形 
树 。 让 我 们 更 仔细 地 看 一 下 代码 。 你 会 看 到 在 第 5 行 和 第 7 行 ， 我 们 正在 进行 递归 调用 。 在 
第 5 行 ， 我 们 在 乌龟 向 右 转 20 度 之 后 立即 进行 递归 调用 ;这 是 上 面 提 到 的 右 树 。 然 后 在 第 7 

行 ， 乌 龟 进行 另 一 个 递归 调用 ， 但 这 一 次 后 堪 转 40 度 。 乌 旬 必 须 向 左 转 40 度 的 原因 是 ， 它 
需要 撤消 原来 的 向 右 转 20 度 ， 然 后 再 向 左 转 20 度 ， 以 绘制 左 树 。 还 要 注意 ， 每 次 我 们 对 树 
进行 递归 调用 时 ， 我 们 从 branchLen 参数 中 减 去 一 些 量 ; 这 是 为 了 确保 递归 树 越 来 越 小 。 你 

还 应 该 看 到 到 第 2 行 的 初始 谎 语句 是 检查 branchLen 的 基本 情况 大 小 。 


def tree(branchLen,t): 
if branchLen > 5: 
t. forward(branchLen) 
t.right(20) 
tree(branchLen-1i5,t) 
t.left(40) 
tree(branchLen-10,t) 
t.right(20) 
t.backward(branchLen) 


Listing 1 


此 树 示例 的 完整 程序 在 ActiveCode 2 中 。 在 运行 代码 之 前 ， 请 思考 你 希望 看 到 的 树 形状 。 看 
着 递归 调用 ， 并 想 想 这 哥 树 将 如 何 展 开 。 它 会 对 称 地 绘制 树 的 右 半边 和 堪 半 边 吗 ? CHAM 


import turtle 


def tree(branchLen,t): 
if branchLen > 5: 

t. forward(branchLen) 
t.right(20) 
tree(branchLen-15,t) 
t.left(40) 
tree(branchLen-15,t) 
t.right(20) 
t. backward(branchLen) 


def main(): 
t = turtle.Turtle() 
myWin = turtle.Screen() 
. left (90) 
-up() 
. backward(100) 


t 
t 
t 
t.down() 


ct 


.color("green") 
tree(75,t) 
myWin.exitonclick() 


main() 


Activecode 2 


注意 树 上 的 每 个 分 支点 如 何 对 应 于 递归 调用 ， 并 注意 树 的 右 半 部 分 如 何 一 直 绘 制 到 它 的 最 短 
的 树枝 。 你 可 以 在 Figure 1 中 看 到 这 一 点 。 现 在 ， 注 意 程 序 如 何 工作 ， 它 的 方式 是 直到 树 的 
整个 右 侧 绘制 完成 回 到 树干 。 你 可 以 在 Figure 2 中 看 到 树 的 右 半 部 分 。 然 后 绘制 树 的 左 侧 ， 
但 不 是 尽 可 能 远 地 向 左 移动 。 相 反 ， 直 到 我 们 进入 到 左 树 最 小 的 枝 干 ， 左 树 的 右 半 部 分 才 开 


始 绘制 。 


RANA Python Turtle Graphics 


Figure 1 


ADO Python Turtle Graphics 


Figure 2 


这 个 简单 的 树 程序 只 是 一 个 起 点 ， 你 会 注意 到 树 看 起 来 不 是 特别 现实 ， 因 为 自然 不 像 计 算 机 
程序 那样 对 称 。 


4.8. 谢 尔 宾 斯 基 三 角形 


另 一 个 展现 自 相似 性 的 分 形 是 谢 尔 宾 斯 基 三 角形 。Figure 3 是 一 个 示例 。 谢 尔 宾 斯 基 三 角形 
阐明 了 三 路 递归 算法 。 用 手绘 制 谢 尔 宾 斯 基 三 角形 的 过 程 很 简单 。 从 一 个 大 三 角形 开始 。 通 


过 连接 每 一 边 的 中 点 ， 将 这 个 大 三 角形 分 成 四 个 新 的 三 角形 。 和 忽略 刚刚 创建 的 中 间 三 角形 ， 
对 三 个 小 三 角形 中 的 每 一 个 应 用 相同 的 过 程 。 每 次 创建 一 组 新 的 三 角形 时 ， 都 会 将 此 过 程 递 
归 应 用 于 三 个 较 小 的 角 三 角形 。 如 果 你 有 足够 的 铅笔 ， 你 可 以 无 限 重复 这 个 过 程 。 在 继续 阅 
读 之 前 ， 你 可 以 尝试 运用 所 描述 的 方法 自己 绘制 谢 尔 宾 斯 基 三 角形 。 





Figure 3: The Sierpinski Triangle 


Figure 3 


因为 我 们 可 以 无 限 地 应 用 算法 ， 什 么 是 基本 情况 ? 我 们 将 看 到 ， 基 本 情况 被 任意 设置 为 我 们 
想 要 将 三 角形 划分 成 块 的 次 数 。 有 时 我 们 把 这 个 数字 称 为 分 形 的 “ 度 "。 每 次 我 们 进行 递归 调 
用 时 ， 我 们 从 度 中 减 去 1， 直 到 0。 当 我 们 达到 0 度 时 ， 我 们 停止 递归 。 在 Figure 3 中 生成 
谢 尔 宾 斯 基 三 角形 的 代码 见 ActiveCode 1 ° 


import turtle 


def drawTriangle(points,color,myTurtle): 
myTurtle.fillcolor(color) 
myTurtle.up() 
myTurtle.goto(points[0][0],points[9][1]) 
myTurtle.down() 
myTurtle.begin_fill() 
myTurtle.goto(points[i][0],points[i][1]) 
myTurtle.goto(points[2][0],points[2][1]) 
myTurtle.goto(points[0][0],points[9][1]) 
myTurtle.end_fill() 


def getMid(p1,p2): 
return ( (p1[0]+p2[0]) / 2, (p1[1] + p2[1]) 7/7 2) 


def sierpinski(points, degree,myTurtle): 
colormap = ['blue', red "green", 'white', 'yellow', 
"violet', 'orange'] 
drawTriangle(points, colormap[degree],myTurtle) 
if degree > 0: 
sierpinski([points[0], 
getMid(points[0], points[i]), 
getMid(points[0], points[2])], 
degree-i, myTurtle) 
sierpinski([points[i], 
getMid(points[0], points[i]), 
getMid(points[i], points[2])], 
degree-1, myTurtle) 
sierpinski([points[2], 
getMid(points[2], points[i]), 
getMid(points[0], points[2])], 
degree-1, myTurtle) 


def main(): 
myTurtle = turtle.Turtle() 
myWin = turtle.Screen() 
myPoints = [[-100, -50], [0,100], [100, -50]] 
sierpinski(myPoints, 3,myTurtle) 
myWin.exitonclick() 


main() 


Activecode 1 


ActiveCode 1 中 的 程序 遵循 上 述 概念 。 谢 尔 宾 斯 基 的 第 一 件 事 是 绘制 外 三 角形 。 接 下 来 ， 有 


三 个 递归 调用 ， 每 个 使 我 们 在 连接 中 点 获得 新 的 三 角形 。 我 们 再 次 使 用 Python 附带 的 
turtle 模块 。 你 可 以 通过 使 用 help('turtle') JAR turtle 可 用 方法 的 详细 信息 。 


看 下 代码 ， 想 想 绘制 三 角形 的 顺序 。 虽 然 三 角 的 确切 顺序 取决 于 如 何 指定 初始 集 ， 我 们 假设 
三 角 按 左下 ， 上 ， 右 下 顺序 。 由 于 谢 尔 宾 斯 基部 数 调 用 自身 ， 谢 尔 宾 斯 基 以 它 的 方式 递归 到 
左下 角 最 小 的 三 角形 ， 然 后 开始 坊 充 其 余 的 三 角形 。 卉 充 左下 角 顶 角 中 的 小 三 角形 。 最 后 ， 
它 填充 在 左下 角 中 右 下 角 的 最 小 三 角形 。 

有 时 ， 根 据 函 数 调 用 图 来 考虑 递归 算法 是 有 帮助 的 。Figure 4 展示 了 递归 调用 总 是 向 左 移 
动 。 活 动 函 数 以 黑色 显示 ， 非 活动 函数 显示 为 灰色 。 向 Figure 4 底部 越 近 ， 三 角形 越 小 。 该 
功能 一 次 完成 一 次 绘制 ; 一 旦 它 完成 了 绘制 ， 它 移动 到 左下 方 底部 中 间 位 置 ， 然 后 继续 这 个 过 


程 。 


Figure 4: Building a Sierpinski Triangle 


Figure 4 


谢 尔 宾 斯 基 画 数 在 很 大 程度 上 依赖 于 getMid 函数 。 getMid 接受 两 个 端点 作为 参数 ， 并 返 
回 它们 之 间 的 中 点 。 此 外 ，ActiveCode 1 还 有 一 个 函数 ， 使 用 begin fill 和 end_fill 方 
法 绘制 填充 一 个 三 角形 。 


4.10. 汉 诺 塔 游戏 


汉 诺 塔 是 由 法 国 数学 家 爱德华 . 卢 卡 斯 在 1883 年 发 明 的 。 他 的 灵感 来 自 一 个 传说 ， 有 一 个 印 
度 教 寺庙 ， 将 迹 题 交 给 年 轻 的 牧师 。 在 开始 的 时 候 ， 牧 师 们 被 给 予 三 根 杆 和 一 堆 64 个 金 碟 ， 
每 个 盘 比 它 下 面 一 个 小 一 点 。 他 们 的 任务 是 将 所 有 64 个 盘子 从 三 个 杆 中 一 个 转移 到 另 一 个 。 
有 两 个 重要 的 约束 ， 它 们 一 次 只 能 移动 一 个 盘子 ， 并 且 它 们 不 能 在 较 小 的 盘子 顶部 上 放置 更 
大 的 盘子 。 牧 师 日 夜 不 停 每 秒 钟 移动 一 块 盘子 。 当 他 们 完成 工作 时 ， 传 说 ， 寺 庙会 变 成 灰 
尘 ， 世 界 将 消失 。 


虽然 传说 是 有 趣 的 ， 你 不 必 担 心 世界 不 久 的 将 来 会 消失 。 移 动 64 个 盘子 的 塔 所 需 的 步骤 数 是 
264 -1 = 18,446,744, 073, 709, 551, 615264-1 = 18, 446,744,973,799, 551, 615 ° 以 每 秒 一 次 的 速 


FE > BP 584,942,417, 355584,942,417,355 年 !。 


Figure 1 展示 了 在 从 第 一 杆 移动 到 第 三 杆 的 过 程 中 的 盘 的 示例 。 请 注意 ， 如 规则 指定 ， 每 个 
杆 上 的 盘子 都 被 堆 登 起来， 以 使 较 小 的 瘟 子 始终 位 于 较 大 盘 的 顶部 。 如 果 你 以 前 没有 尝试 过 
解决 这 个 难题 ， 你 现在 应 该 尝试 下 。 你 不 需要 花哨 的 盘子 ， 一 堆 书 或 纸张 都 可 以 。 


fromPole withPole toPole 


Figure 1 


我 们 如 何 递 归 地 解决 这 个 问题 ?我 们 的 基本 情况 是 什么 ?了 让 我 们 从 下 到 上 考虑 这 个 问题 。 假 
设 你 有 一 个 五 个 盘子 的 塔 ， 在 杆 一 上 。 如 果 你 已 经 知道 如 何 将 四 个 盘子 移动 到 杆 二 上 ， 那 么 
你 可 以 轻松 地 将 最 底部 的 盘子 移动 到 杆 三 ， 然 后 再 将 四 个 盘子 从 杆 二 移动 到 杆 三 。 但 是 如 果 
你 不 知道 如 何 移动 四 个 盘子 怎么 办 ? 假设 你 知道 如 何 移动 三 个 瘟 子 到 杆 三 ;那么 很 容易 将 第 四 
个 盘子 移动 到 杆 二 ， 并 将 它们 从 杆 三 移动 到 它们 的 顶部 。 但 是 如 果 你 不 知道 如 何 移动 三 个 瘟 
FR? 如 何 将 两 个 盘子 移动 到 杆 二 ， 然 后 将 第 三 个 盘子 移动 到 杆 三 ， 然 后 移动 两 个 盘 子 到 它 
的 顶部 ?但 是 如 果 你 还 不 知道 该 怎么 办 呢 ?当然 你 会 知道 移动 一 个 盘子 到 杆 三 足够 容易 。 这 
听 起 来 像 是 基本 情况 。 


这 里 是 如 何 使 用 中 间 杆 将 塔 从 起 始 杆 移 动 到 目标 杆 的 步骤 : 


1. 使 用 目标 杆 将 height-1 的 塔 移 动 到 中 间 杆 。 


2. 将 剩余 的 盘子 移动 到 目标 杆 。 
3. 使 用 起 始 杆 将 height-1 的 塔 愉 中 间 杆 移动 到 目标 杆 。 


只 要 我 们 遵守 规则 ， 较 大 的 盘子 保留 在 栈 的 底部 ， 我 们 可 以 使 用 递归 的 三 个 步 又， 处理 任何 
更 大 的 盘子 。 上 面 概要 中 唯一 缺失 的 是 识别 基本 情况 。 最 简单 的 汉 诺 塔 是 一 个 盘子 的 塔 。 在 
这 种 情况 下 ， 我 们 只 需要 将 一 个 盘子 移动 到 其 最 终 目的 地 。 一 个 盘子 的 塔 将 是 我 们 的 基本 情 
况 。 此 外 ， 上 述 步 骤 通 过 在 步骤 1 和 3 中 减 小 塔 的 高 度 ， 使 我 们 趋向 基本 情况 。Listing 1 展示 
了 解决 汉 诺 塔 的 Python 代码 。 


def moveTower(height, fromPole, toPole, withPole): 
if height >= 1: 
moveTower (height-1, fromPole, withPole, toPole) 
moveDisk(fromPole, toPole) 
moveTower (height-1,withPole, toPole, fromPole) 


Listing 1 


请 注意 ，Listing 1 中 的 代码 与 描述 几乎 相同 。 算 法 的 简单 性 的 关键 在 于 我 们 进行 两 个 不 同 的 
递 具 调用 ， 一 个 在 第 3 行 上 ， 另 一 个 在 第 5 行 。 在 第 3 行 上 ， 我 们 将 初始 杆 上 的 底部 圆 盘 移 
动 到 中 间 。 下 一 行 简单 地 将 底部 盘 移 动 到 其 最 终 的 位 置 。 然 后 在 第 5 行 上 ， 我 们 将 塔 从 中 间 
杆 移动 到 最 大 盘子 的 顶部 。 当 塔 高 度 为 0 时 检测 到 基本 情况 ; 在 这 种 情况 下 不 需要 做 什么 ， 所 
以 moveTower maak) BHR o RPV FPA AAHRAY IL =A > UM moveTower 简 
单 地 返回 以 使 moveDisk HARHA ° 


函数 moveDisk ， 如 Listing 2 所 示 ， 非 常 简单 。 它 所 做 的 就 是 打印 出 一 个 盘子 从 一 杆 移动 到 
另 一 杆 。 如 果 你 输入 并 运行 moveTower 程序 ， 你 可 以 看 到 它 给 你 一 个 非常 有 效 的 解决 方案 。 


def moveDisk(fp, tp): 
print("moving disk from",fp,"to",tp) 


Listing 2 


现在 你 已 经 看 到 了 moveTower 和 movedisk 的 代码 ， 你 可 能 会 想 知 道 为 什么 我 们 没有 明确 记 
录 什 么 盘子 在 什么 杆 上 的 数据 结构 。 这 里 有 一 个 提示 : 如 果 你 要 明确 地 跟踪 盘子 ， 你 会 使 用 
三 个 Stack 对 象 ， 每 个 杆 一 个 。 答案 是 Python 提供 了 我 们 需要 调用 的 隐 含 的 栈 。 


4.11. 探 索 迷 宫 


4.11. 探 索 迷 宫 


在 这 一 节 中 ， 我 们 将 讨论 一 个 与 扩展 机 器 人 世界 相关 的 问题 : 你 如 何 找到 自己 的 迷宫 ? 如 果 
你 在 你 的 宿舍 有 一 个 扫地 机 器 人 (不 是 所 有 的 大 学 生 ? ) 你 希望 你 可 以 使 用 你 在 本 节 m 
的 知识 重新 给 它 编程 。 我 们 要 解决 的 问题 是 帮助 我 们 的 乌龟 在 虚拟 迷宫 中 找到 出 路 。 KEM 
题 的 根源 与 希腊 的 神话 有 关 ， 传 说 或 修 斯 被 送 入 迷 官 中 以 杀 死 人 身 牛 头 怪 。 蕊 修 斯 用 了 一 卷 
线 帮助 他 找到 回去 的 退路 ， 当 他 完成 杀 死 野 普 的 任务 。 在 我 们 的 问题 中 ， 我 们 将 假设 我 们 的 
乌龟 在 迷宫 中 间 的 菜 处 ， 必 须 找到 出 路 。 看 看 Figure 2， 了 解 我 们 将 在 本 节 中 做 什么 


ANM Python Turtle Graphs 





Figure 2 


we 
墙壁 占据 。 乌 龟 只 能 通过 迷宫 的 空 aad oo ， 它 必须 尝试 不 同 的 方向 。 
: 龟 将 需要 一 个 程序 ， 以 找到 迷宫 的 出 路 。 过 程 : 


T 我 们 将 首先 尝试 向 北 一 格 ， 然 后 从 那里 递归 地 尝试 我 们 的 程序 。 

2， 如 果 我 们 通过 尝试 向 北 作 为 第 一 步 没有 成 功 ， 我 们 将 向 南 一 格 ， 并 递归 地 重复 我 们 的 程 
序 。 

3， 如 果 向 南 也 不 行 ， 那 么 我 们 将 尝试 向 西 一 格 ， 并 递归 地 重复 我 们 的 程序 。 

4 如 果 北 ， 南 和 西 都 没有 成 功 ， 则 应 用 程序 从 当前 位 置 递 归 向 东 。 

5， 如 果 这 些 方向 都 没有 成 功 ， 那 么 没有 办 法 离开 迷宫 ， 我 们 失败 。 

现在 ， 这 听 起 来 很 容易 ， 但 有 几 个 细节 先 谈 谈 。 假 设 我 们 第 一 步 是 向 北 走 。 按 照 我 们 的 程 

序 ， 我 们 的 下 一 步 也 将 是 向 北 。 但 如 果 北 面 被 一 堵 墙 阻挡 ， 我 们 必须 看 看 程序 的 下 一 步 ， 并 

试 着 向 南 。 不 幸 的 是 ， 向 南 使 我 们 回 到 原来 的 起 点 。 如 果 我 们 从 那里 再 次 应 用 递归 过 程 ， 我 

们 将 又 回 到 向 北 一 格 ， 并 陷入 无 限 循 环 。 所 以 ， 我 们 必须 有 一 个 策略 来 记 住 我 们 去 过 哪 。 在 
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这 种 情况 下 ， 我 们 假设 有 一 袋 面 包 届 可 以 搬 在 我 们 走 过 的 路 上 。 如 果 我 们 沿 某 个 方向 返 出 一 
步 ， 发现 那 个 位 置 上 已 经 有 面包 届 ， 我 们 应 该 立即 后 退 并 尝试 程序 中 的 下 一 个 方向 。 我 们 看 
看 这 个 算法 的 代码 ， 就 像 从 递归 函数 调用 返回 一 样 简单 。 


正如 我 们 对 所 有 递归 算法 所 做 的 一 样 ， 让 我 们 回顾 一 下 基本 情况 。 其 中 一 些 你 可 能 已 经 根据 
前 一 段 的 描述 猜 到 了 。 在 这 种 算法 中 ， 有 四 种 基本 情况 要 考虑 : 


乌龟 撞 到 了 墙 。 由 于 这 一 格 被 墙壁 占据 ， 不 能 进行 进一步 的 探索 。 

乌龟 找到 一 个 已 经 探索 过 的 格 。 我 们 不 想 继续 从 这 个 位 置 探索 ， 否 则 会 陷入 循环 。 

我 们 发 现 了 一 个 外 边缘 ， 没 有 被 墙壁 占据 。 换 名 话说 ， 我 们 发 现 了 迷宫 的 一 个 出 口 。 
我 们 探索 了 一 格 在 四 个 方向 上 都 没有 成 功 。 

为 了 我 们 的 程序 工作 ， 我 们 将 需要 有 一 种 方式 来 表示 迷宫 。 为 了 使 这 个 更 有 趣 ， 我 们 将 使 用 
turtle 模块 来 绘制 和 探索 我 们 的 迷宫 ， 以 使 我 们 看 到 这 个 算法 的 功能 。 迷 宫 对 象 将 提供 以 下 
方法 让 我 们 在 编写 搜索 算法 时 使 用 : 


e O Do 


© _init 读 取 迷宫 的 数据 文件 ， 初 始 化 迷宫 的 内 部 表示 ， 并 找到 乌龟 的 起 始 位 置 。 
e@ drawaze 在 屏幕 上 的 一 个 窗口 中 绘制 迷宫 。 

© updatePosition 更 新 迷宫 的 内 部 表示 ， 并 更 改 窗 口中 乌龟 的 位 置 。 

e isExit 检查 当前 位 置 是 否 是 迷宫 的 退出 位 置 。 


Maze 类 还 重 载 索 引 运 算 符 [] ， 以 便 我 们 的 算法 可 以 轻松 访问 任何 特定 格 的 状态 。 


让 我 们 来 查看 称 为 searchFrom 的 搜索 函数 的 代码 。 代 码 如 Listing 3 所 示 。 请 注意 ， 此 函数 
需要 三 个 参数 : 迷宫 对 象 ， 起 始 行 和 起 始 列 。 这 很 重要 ， 因 为 作为 递归 函数 ， 搜 索 在 每 次 递 
归 调 用 时 开始 。 


def searchFrom(maze, startRow, startColumn): 
maze.updatePosition(startRow, startColumn) 
# Check for base cases: 
# 1. We have run into an obstacle, return false 
if maze[startRow][startColumn] == OBSTACLE : 
return False 
# 2. We have found a square that has already been explored 
if maze[startRow][startColumn] == TRIED: 
return False 
# 3. Success, an outside edge not occupied by an obstacle 
if maze.isExit(startRow, startColumn): 
maze.updatePosition(startRow, startColumn, PART_OF_PATH) 
return True 
maze.updatePosition(startRow, startColumn, TRIED) 


# Otherwise, use logical short circuiting to try each 

# direction in turn (if needed) 

found = searchFrom(maze, startRow-1, startColumn) or \ 
searchFrom(maze, startRow+1, startColumn) or \ 
searchFrom(maze, startRow, startColumn-1) or \ 
searchFrom(maze, startRow, startColumn+1) 

if found: 


maze.updatePosition(startRow, startColumn, PART_OF_PATH) 
else: 


maze.updatePosition(startRow, startColumn, DEAD_END) 
return found 


Listing 3 


你 会 看 到 代码 的 第 一 行 (472) 调用 updatePosition 。 这 只 是 为 了 可 视 化 算法 ， 以 便 你 可 以 
ee ee 迷宫 。 接 下 来 算法 检查 四 种 基本 情况 中 的 前 三 种 : 乌龟 是 否 碰 到 墙 
Mt 出 口 ( 行 11) ? 如 果 
条 件 都 不 为 牙 ， 则 我 们 继续 递归 搜索 。 


注意 到 ， 在 递归 步骤 中 有 四 个 对 searchFrom 的 递归 调用 。 很 难 预测 将 有 多 少 个 递归 调 

， 因 为 它们 都 由 or 语句 连接 。 如 果 对 searchFrom 的 第 一 次 调用 返回 true ， 则 不 需要 
eS 个 调用 。 你 可 以 理解 这 一 步 向 (row-1,column) (或 北 ， 如 果 你 从 地 理 位 置 上 思考 ) 是 
在 迷宫 的 路 径 上 。 如 果 没 有 一 个 好 的 路 径 向 北 ， 那 么 尝试 下 一 个 向 南 的 递归 调用 。 如 果 向 南 
失败 ， 然 后 尝试 向 西 ， 最 后 向 东 。 如 果 所 有 四 个 递归 调用 返回 False ， 那 么 认为 是 一 个 死 胡 
同 。 你 应 该 下 载 或 输入 整个 程序 ， 并 通过 更 改 这 些 调用 的 顺序 进行 实验 。 


Maze 类 的 代码 如 Listing 4，Listing 5 - a 6 所 示 。 _ init 方法 将 文件 的 名 称 作为 
其 唯一 参数 。 此 文件 是 一 个 文本 文件 ， 通 过 使 用 + ， 空 格 表示 空心 方块 ， 并 使 
用 字母 s 表示 起 始 位 置 。Figure 3 是 迷宫 数据 文件 的 示例 。 迷 宫 的 内 部 表示 是 列表 的 列表 。 
mazelist 实例 变量 的 每 一 行 也 是 一 个 列表 。 此 辅助 列表 使 用 上 述 字 符 ， 每 格 表 示 一 个 字符 。 
Figure 3 中 的 数据 文件 ， 内 部 表示 如 下 所 示 : 


[ ['+' pt EA Lm HB eS Get te De '+','+'], 
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ct 了 $ + f: T A Ui 了 十 了 $ + , a ly 
IE, Ga NO WEA PENG, An Mt ge, Vero Sh ch SS RTP IP K SAR E E TETA 
aE 1 + 了 十 f TSN 十 了 a 7 $ ate 了 了 了 十 1, 
Eee u es FT i A ene A La io Tae alee 
het, Do Then ih ARETE Uni) ER EA a iste Th 9 Tenet) aii direst UA eri} 
Ea $ + S ar k + 六 E 了 ote fi + f a 了 十 了 了 十 1, 
out Ue atte WR EY eee ee 0) ST Tim hens i Uae th 
a 了 $ È Fn + 了 AP 了 A i3 + 了 了 十 ly 
OP 和 
a 了 É + 了 + Li LTT 了 $ + 了 了 了 了 十 l, 
和 he Ue oie Det S ie th era hat 0 
pear 了 了 了 AIRA 了 了 十 了 r + , v , + 1], 
|B he pee TL] 


drawMaze 方法 使 用 这 个 内 部 表示 在 屏幕 上 绘制 迷宫 的 初始 视图 。 


Figure 3 : 示例 迷宫 数据 文件 
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Figure 3 


如 Listing 5 所 示 ， updatePosition 方法 使 用 相同 的 内 部 表示 来 查看 乌 旬 是 否 遇 到 了 墙 。 它 还 
用 . 或 - 更 新 内 部 表示 ， 以 表示 乌龟 已 经 访问 了 特定 格子 或 者 格子 是 死角 。 此 

外 ， updatePosition 方法 使 用 两 个 辅助 方法 moveturtle 和 dropBreadCrumb 来 更 新 屏幕 上 的 
视图 。 


最 后 ，isExit 方法 使 用 乌龟 的 当前 位 置 来 检测 退出 条 件 。 退 出 条 件 是 当 乌 龟 已 经 到 迷宫 的 边 
缘 时 ， 即 行 零 或 列 零 ， 或 者 在 最 右边 列 或 底部 行 。 


class Maze: 


def _ init__(self,mazeFileName): 


Listing 4 


rowsInMaze = 0 


0 
[] 


mazeFile = open(mazeFileName, 'r') 


columnsInMaze 


self.mazelist 


rowsInMaze = 0 
for line in mazeFile: 
rowList = [] 
col = 0 
for ch in line[:-1]: 
rowList.append(ch) 
if ch == 'S!: 
self.startRow = rowsInMaze 
self.startCol 
col = col + 1 


col 


rowsInMaze = rowsInMaze + 1 
self .mazelist.append(rowList) 
columnsInMaze = len(rowList) 


self.rowsInMaze = rowsInMaze 
self.columnsInMaze = columnsInMaze 
self.xTranslate = -columnsInMaze/2 
self.yTranslate = rowsInMaze/2 
self.t = Turtle(shape='turtle' ) 
setup(width=600, height=600) 
setworldcoordinates(-(columnsInMaze-1)/2-.5, 
-(rowsInMaze-1)/2-.5, 
(columnsInMaze-1)/2+.5, 
(rowsInMaze-1)/2+.5) 


def 


def 


def 


def 


def 


drawMaze(self): 
for y in range(self.rowsInMaze): 
for x in range(self.columnsInMaze): 
if self.mazelist[y][x] == OBSTACLE: 
self .drawCenteredBox(x+self.xTranslate, 
-y+self.yTranslate, 
"tan') 
self.t.color('black', 'blue') 


drawCenteredBox(self,x,y,color): 

tracer (0) 

self.t.up() 

self.t.goto(x-.5,y-.5) 

self.t.color('black',color) 

self.t.setheading(90) 

self.t.down() 

self.t.begin_fill() 

for i in range(4): 
self.t.forward(1) 
self.t.right(90) 

self.t.end_fill() 

update() 

tracer(1) 


moveTurtle(self,x,y): 

self.t.up() 

self.t.setheading(self.t.towards(x+self.xTranslate, 
-y+self.yTranslate) ) 

self.t.goto(xt+self.xTranslate, -ytself.yTranslate) 


dropBreadcrumb(self, color): 
self.t.dot(color) 


updatePosition(self, row, col, val=None): 
if val: 

self.mazelist[row][col] = val 
self.moveTurtle(col, row) 


if val == PART_OF_PATH: 


color = 'green' 
elif val == OBSTACLE: 
color = 'red' 
elif val == TRIED: 
color = 'black' 
elif val == DEAD_END: 
color = 'red' 


else: 
color = None 


if color: 
self .dropBreadcrumb(color) 


Listing 5 


def isExit(self, row, col): 


return (row == 0 or 
row == self.rowsInMaze-1 or 
col == 0 or 
col == self.columnsInMaze-1 ) 


def _ getitem (self, idx): 
return self.mazelist[idx] 


Listing 6 


4.12. 动 态 规划 


计算 机 科学 中 的 许多 程序 是 为 了 优化 一 些 值 而 编写 的 ; 例如 ， 找 到 两 个 点 之 间 的 最 短路 径 ， 找 
到 最 适合 一 组 点 的 线 ， 或 找到 满足 某 些 标准 的 最 小 对 象 集 。 计 算 机 科学 家 使 用 许多 策略 来 解 
决 这 些 问题 。 本 书 的 目标 之 一 是 向 你 展示 几 种 不 同 的 解决 问题 的 策略 。 动态 规划 是 这 些 类 型 
的 优化 问题 的 一 个 策略 。 


优化 问题 的 典型 例子 包括 使 用 最 少 的 硬币 找 零 。 假 设 你 是 一 个 自动 售 货 机 制造 商 的 程序 员 。 
你 的 公司 希望 通过 给 每 个 交易 最 少 硬币 来 简化 工作 。 假 设 客户 放 入 1 美元 的 钞票 并 购买 37 美 
分 的 商品 。 你 可 以 用 来 找 零 的 最 小 数量 的 硬币 是 多 少 ? 了 答案 是 六 个 硬币 : 两 个 25 美 分 ， 一 个 
10 美 分 和 三 个 一 美 分。 我 们 如 何 得 到 六 个 硬币 的 答案 ?我 们 从 最 大 的 硬币 (25 美 分 ) FH 
始 ， 并 尽 可 能 多 ， 然 后 我 们 去 找 下 一 个 小 点 的 硬币 ， 并 尽 可 能 多 的 使 用 它们 。 这 第 一 种 方法 
被 称 为 贪 焚 方 法 ， 因 为 我 们 试图 尽快 解决 尽 可 能 大 的 问题 。 


当 我 们 使 用 美国 货币 时 ， 贪 禁 的 方法 工作 正常 ， 但 是 假设 你 的 公司 决定 在 埃 尔 博 尼 亚 部 署 自 
动 贩卖 机 ， 除 了 通常 的 1，5，10 和 25 分 硬币 ， 他 们 还 有 一 个 21 分 硬币 。 在 这 种 情况 下 ， 
我 们 的 贪 禁 的 方法 找 不 到 63 美 分 的 最 佳 解决 方案 。 随 着 加 入 21 分 硬币 ， 贪 禁 的 方法 仍然 会 
找到 解决 方案 是 六 个 硬币 。 然 而 ， 最 佳 答案 是 三 个 21 分 。 


让 我 们 看 一 个 方法 ， 我 们 可 以 确定 会 找到 问题 的 最 佳 答案 。 由 于 这 一 节 是 关于 递归 的 ， 你 可 
能 已 经 猜 到 我 们 将 使 用 递归 解决 方案 。 让 我 们 从 基本 情况 开始 ， 如 果 我 们 可 以 与 我 们 硬币 的 
价值 相同 的 金额 找 零 ， 答 案 很 容易 ， 一 个 硬币 。 


如 果 人 金额 不 匹配 ， 我 们 有 几 个 选项 。 我 们 想 要 的 是 最 低 一 个 一 分 钱 加 上 原始 金额 减 去 一 分 钱 

所 需 的 硬币 数量 ， 或 者 一 个 5 美 分 如 上 原始 金额 减 去 5 美 分 所 需 的 硬币 数量 ， 或 者 一 个 10 美 
分 加 上 原始 金额 减 去 10 美 分 所 需 的 硬币 数量 ， 等 等 。 因 此 ， 需 要 对 原始 金额 找 零 硬币 数量 可 
以 根据 下 式 计 算 : 


1 + numCoins(originalamount — 1) 
1 + numCoins(originalamount — 5) 
1 + numCoins(originalamount — 10) 
1 + numCoins(originalamount — 25) 


numCoins = min 


执行 我 们 刚才 描述 的 算法 如 Listing 7 所 示 。 在 第 3 行 ， 我 们 检查 基本 情况 ;也 就 是 说 ， 我 们 正 
试图 支付 硬币 的 确切 金额 。 如 果 我 们 没有 等 于 找 零 数量 的 硬币 ， 我 们 递归 调用 每 个 小 于 找 零 
额 的 不 同 的 硬币 值 。 第 6 行 显示 了 我 们 如 何 使 用 列表 推导 将 硬币 列表 过 渡 到 小 于 当前 找 零 的 
硬币 列表 。 叫 归 调 用 也 减少 了 由 所 选 硬币 的 值 所 需要 的 总 找 零 量 。 叫 归 调 用 在 第 7 行 。 注 意 
在 同一 行 ， 我 们 将 硬币 数 a ， 以 说 明 我 们 正在 使 用 一 个 硬币 的 事实 。 


def recMC(coinValueList, change): 
minCoins = change 
if change in coinValueList: 
KeEUGnT 
elise: 
for i in [c for c in coinValueList if c <= change]: 
numCoins = 1 + recMC(coinValueList, change-i) 
if numCoins < minCoins: 
minCoins = numCoins 
return minCoins 


print(recMC([1,5,10, 25], 63)) 


Listing 7 


Listing 7 中 的 算法 是 非常 低 效 的 。 事 实 上 ， 它 需要 67,716,925 个 递归 调用 来 找到 4 个 硬币 
的 最 佳 解决 63 美 分 问题 的 方案 。 要 理解 我 们 方法 中 的 致命 缺陷 ， 请 参见 Figure 5， 其 中 显示 
了 377 个 函数 调用 所 需 的 一 小 部 分 ， 找 到 支付 26 美 分 的 最 佳 硬币 。 


图 中 的 每 个 节点 对 应 于 对 recMc 的 调用 。 节 点 上 的 标签 表示 硬币 数量 的 变化 量 。 稍 头 上 的 标 
签 表示 我 们 刚刚 使 用 的 硬币 。 通 过 跟随 图 表 ， 我 们 可 以 看 到 硬币 的 组 合 。 主 要 的 问题 是 我 们 
重复 做 了 太 多 的 计算 。 例 如 ， 该 图 表示 该 算法 重复 计算 了 至 少 三 次 支付 15 美 分 。 这 些 计 算 找 
到 15 美 分 的 最 佳 硬币 数量 的 步骤 本 身 需 要 52 个 函数 调 有 用。 显然， 我 们 浪费 了 大 量 的 时 间 和 精 
力 重新 计算 昌 的 结果 。 





Figure 5 


减少 我 们 工作 量 的 关键 是 记 住 一 些 过 去 的 结果 ， 这 样 我 们 可 以 避免 重新 计算 我 们 已 经 知道 的 
结果 。 一 个 简单 的 解决 方案 是 将 最 小 数量 的 硬币 的 结果 存储 在 表 中 。 然 后 在 计算 新 的 最 小 值 
之 前 ， 我 们 首先 检查 表 ， 看 看 结果 是 否 已 知 。 如 果 表 中 已 有 结果 ， 我 们 使 用 表 中 的 值 ， 而 不 
是 重新 计算 。 ActiveCode 1 显示 了 一 个 修改 的 算法 ， 以 合并 我 们 的 表 查 找 方案 。 


def recDC(coinValueList, change, knownResults): 
minCoins = change 
if change in coinValueList: 
knownResults[change] = 1 
return 1 
elif knownResults[change] > 0: 
return knownResults[change] 
ellise: 
for i in [c for c in coinValueList if c <= change]: 
numCoins = 1 + recDC(coinValueList, change-i, 
knownResults) 
if numCoins < minCoins: 
minCoins = numCoins 
knownResults[change] = minCoins 
return minCoins 


print(recDC([1,5,10,25], 63, [0]*64)) 


ActiveCode 1 


注意 ， 在 第 6 行 中 ， 我 们 添加 了 一 个 测试 ， 看 看 我 们 的 列表 是 否 包 含 此 找 零 的 最 小 硬币 数 
量 。 如 果 没 有 ， 我 们 递归 计算 最 小 值 ， 并 将 计算 出 的 最 小 值 存储 在 列表 中 。 使 用 这 个 修改 的 
算法 减少 了 我 们 需要 为 四 个 硬币 递归 调用 的 数量 ，63 美 分 问题 只 需 221 次 调用 |! 


虽然 AcitveCode 1 中 的 算法 是 正确 的 。 事 实 上 ， 我 们 所 做 的 不 是 动态 规划 ， 而 是 我 们 通过 使 
用 称 为 记忆 化 的 技术 来 提高 我 们 的 程序 的 性 能 ， 或 者 更 常见 的 叫做 缓存 。 


一 个 站 正 的 动态 编程 算法 将 采取 更 系统 的 方法 来 解决 这 个 问题 。 我 们 的 动态 编程 解决 方案 将 
从 找 零 一 分 钱 开始 ， 并 系统 地 找到 我 们 需要 的 找 零 额 。 这 保证 我 们 在 算法 的 每 一 步 ， 已 经 知 
道 为 任何 更 小 的 数量 进行 找 零 所 需 的 最 小 硬币 数量 。 


让 我 们 看 看 如 何 找到 11 美 分 所 需 的 最 小 找 零 数量。Figure 4 说 明了 该 过 程 。 我 们 从 一 分 钱 开 
始 。 唯 一 的 解决 方案 是 一 个 硬币 (一 分 钱 ) 。 下 一 行 显示 一 分 和 两 分 的 最 小 值 。 再 次 ， 唯 一 
的 解决 方案 是 两 分 钱 。 第 五 行事 情 变 得 有 趣 。 现 在 我 们 有 两 个 选择 ， 五 个 一 分 钱 或 一 个 五 分 
钱 。 我 们 如 何 决定 哪个 是 最 好 的 ? 我 们 查阅 表 ， 看 到 需要 找 零 四 美 分 的 硬币 数量 是 四 ， 再 加 
一 个 一 分 钱 是 五 ， 等 于 五 个 硬币 。 或 者 我 们 可 以 尝试 0 分 加 一 个 五 分 ， 五 分 钱 等 于 一 个 硬 
币 。 由 于 一 和 五 最 小 的 是 一 ， 我 们 在 表 中 存储 为 一 。 再 次 快 进 到 表 的 末尾 ， 考 虑 11 美 分 。 
Figure 5 展示 了 我 们 要 考虑 的 三 个 选项 : 


1， 一 个 一 分 钱 加 上 11-1 = 16 分 (1) 的 最 小 硬币 数 
2， 一 个 五 分 钱 加 上 11-5 = 6 分 (2) 的 最 小 硬币 数 
3， 一 个 十 分 钱 加 上 11-16 = 1 分 (1) 最 小 硬币 数 


4.12. 动 态 规划 


选项 1 或 3 总 共 需 要 两 个 硬币 ， 这 是 11 美 分 的 最 小 硬币 数 。 


Change to Make 





Step of the Algorithm 
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Listing 8 用 一 个 动态 规划 算法 来 解决 我 们 的 找 零 问题 。 dpMakechange 有 三 个 参数 : 一 个 有 效 
硬币 值 的 列表 ， 我 们 要 求 的 找 零 额 ， 以 及 一 个 包含 每 个 值 所 需 最 小 硬币 数量 的 列表 。 当 函 数 
完成 时 ， mincoins 将 包含 从 0 到 找 零 值 的 所 有 值 的 解 。 


def dpMakeChange(coinValueList,change,minCoins): 
for cents in range(change+1): 
coinCount = cents 
for j in [c for c in coinValueList if c <= cents]: 
if minCoins[cents-j] + 1 < coinCount: 
coinCount = minCoins[cents-j]+1 
minCoins[cents] = coinCount 
return minCoins[change ] 


Listing 8 
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注意 ， dpMakechange 不 是 递归 有 函数， 即使 我 们 开始 使 用 递归 解决 这 个 问题 。 重 要 的 是 要 意识 
到 ， 你 可 以 为 问题 写 一 个 递归 解决 方案 但 并 不 意味 着 它 是 最 好 的 或 最 有 效 的 解决 方案 。 在 这 
个 函数 中 的 大 部 分 工作 是 通过 从 第 4 行 开始 的 循环 来 完成 的 。 在 这 个 循环 中 ， 我 们 考虑 使 用 
所 有 可 能 的 硬币 对 指定 的 金额 进行 找 零 。 就 像 我 们 上 面 的 11 分 的 例子 ， 我 们 记 住 最 小 值 ， 并 
将 其 存储 在 我 们 的 mincoins 列表 。 


虽然 我 们 的 找 零 算法 很 好 地 找 出 最 小 数量 的 硬币 ， 但 它 不 帮助 我 们 找 零 ， 因 为 我 们 不 跟踪 我 
们 使 用 的 硬币 。 我 们 可 以 轻松 地 扩展 dpMakechange 来 跟踪 硬币 使 用 ， 只 需 记 住 我 们 为 每 个 条 
目 添加 的 最 后 一 个 硬币 到 mincoins 表 。 如 果 我 们 知道 添加 的 最 后 一 个 硬币 值 ， 我 们 可 以 简 
单 地 减 去 硬币 的 值 ， 在 表 中 找到 前 一 个 条 目 ， 找 到 该 金额 的 最 后 一 个 硬币 。 我 们 可 以 通过 表 
继续 跟踪 ， 直 到 我 们 开始 的 位 置 。 


ActiveCode 2 展示 了 dpMakechange 算法 修改 为 跟踪 使 用 的 硬币 ， 以 及 一 个 函数 printcoins 
通过 表 打 印 出 使 用 的 每 个 硬币 的 值 。 前 两 行 主 要 设置 要 找 零 的 金额 ， 并 创建 使 用 的 硬币 列 

表 。 接 下 来 的 两 行 创建 了 我 们 需要 存储 结果 的 列表 。 coinsused 是 用 于 找 零 的 硬币 的 列表 ， 
并 且 coincount 是 与 列表 中 的 位 置 相 对 应 进行 找 零 的 最 小 硬币 数 。 

注意 ， 我 们 打印 的 硬币 直接 来 自 coinsused 数组 。 对 于 第 一 次 调用 ， 我 们 从 数组 位 置 63 开 


始 ， 然 后 打印 21 。 然 后 我 们 取 63-21 = 42 ， 看 看 列表 的 第 42 个 元 素 。 我 们 再 次 找到 21 
存储 在 那里 。 最 后 ， 数 组 第 21 个 元 素 21 也 包含 21， 得 到 三 个 21。 


def dpMakeChange(coinValueList, change, minCoins, coinsUsed): 
for cents in range(change+1): 
coinCount = cents 
newCoin = 1 
for j in [c for c in coinValueList if c <= cents]: 
if minCoins[cents-j] + 1 < coinCount: 
coinCount = minCoins[cents-j]+1 
newCoin = j 
minCoins[cents] = coinCount 
coinsUsed[cents] = newCoin 
return minCoins[change] 


def printCoins(coinsUsed, change): 
coin = change 
while coin > 0: 
thisCoin = coinsUsed[coin] 
print(thisCoin) 
coin = coin - thisCoin 


def main(): 
amnt = 63 
clist = [1,5,10, 21,25] 
coinsUsed = [0]*(amnt+1) 
coinCount = [0]*(amnt+1) 


print("Making change for", amnt,"requires") 

print (dpMakeChange(clist, amnt, coinCount, coinsUsed), "coins" 
print("They are:") 

printCoins(coinsUsed, amnt ) 

print("The used list is as follows:") 

print (coinsUsed) 


main() 


AcitveCode 2 


Making change for 63 requires 

3 coins 

They are: 

21 

21 

21 

The used list is as follows: 

(fal, aly aly al, Sl Gp sh, ake al, Sl, alo al, “al, sh, ah. Gy ale al, al, Gh, Sie), Wil al, al, al, Bey, al, 
ily, “ab aly Ge alo). Gh, a als alo), al. SN. ale a, ee aI al ah aL, aif) al, al, as “SL. Aaa. e ao), 
i, abe Sy al), ale al. Al, allo}. al, Alo). Pali 


4.12. 动 态 规划 


130 


4.13. 总 结 


在 本 章 中 ， 我 们 讨论 了 几 个 递归 算法 的 例子 。 选择 这 些 葛 法 来 揭示 几 个 不 同 的 问题 ， 其 中 递 
归 是 一 种 有 效 的 问题 解决 技术 。 本 章 要 记 住 的 要 点 如 下 : 


e 所 有 递归 算法 都 必须 具有 基本 情况 。 

。 递归 算法 必须 改变 其 状态 并 朝 基 本 情况 发 展 。 

。 递归 算法 必须 调用 自身 (递归 ) © 

o 递归 在 某 些 情况 下 可 以 代替 迭代 。 

o 递归 算法 通常 可 以 自然 地 映射 到 你 尝试 解决 的 问题 的 表达 式 。 

。 递归 并 不 总 是 答案 。 有 时 ， 递 归 解 决 方案 可 能 比 先 代 算法 在 计算 上 更 兄 贵 。 


5. 排 序 和 搜索 


132 


5.1. 目 标 


能 够 解释 和 实现 顺序 查找 和 二 分 查找 。 

© 能 够 解释 和 实现 选择 排序 ， 冒 泡 排 序 ， 归 并 排序 ， 快 速 排序 ， 插 入 排序 和 shell 排序 。 
oe 理解 哈 希 作为 搜索 技术 的 思想 。 

o 引入 映射 抽象 数据 类 型 。 

e 使 用 哈 希 实现 Map 抽象 数据 类 型 。 


5.2. 搜 索 


我 们 现在 把 注意 力 转 向 计算 中 经 常 出 现 的 一 些 问题 ， 即 搜索 和 排序 问题 。 在 本 节 中 ， 我 们 将 
研究 搜索 。 我 们 将 在 本 章 后 面 的 章节 中 介绍 。 人 。 搜 
索 通常 对 于 项 是 否 存 在 返回 True 或 False。 有 时 它 可 能 返回 项 被 找到 的 地 方 。 我 们 在 这 里 将 
仅 关注 成 员 是 否 存 在 这 个 问题 。 


在 Python 中 ， 有 一 个 非常 简单 的 方法 来 询问 一 个 项 是 否 在 一 个 项 列表 中 。 我 们 使 用 in 运算 
符 。 


>>> 15 in [3,5,2,4,1] 
False 

>>> 3 in [3,5,2,4,1] 
True 

>>> 


这 很 容易 写 ， 一 个 底层 的 操作 替 我 们 完成 这 个 工作 。 事 实证 明 ， 有 很 多 不 同 的 方法 来 搜索 。 
我 们 在 这 里 感 兴 趣 的 是 这 些 算 法 如 何 工 作 以 及 它们 如 何 相互 比较 。 


5.3. 顺 友 上 查找 


当 数 据 项 存储 在 诸如 列表 的 集合 中 时 ， 我 们 说 它们 有 具有 线性 或 顺序 关系 。 每 个 数据 项 都 存储 
在 相对 于 其 他 数据 项 的 位 置 。 在 Python 列表 中 ， 这 些 相 对 位 置 是 单个 项 的 索引 值 。 由 于 这 
些 索 引 值 是 有 序 的 ， 我 们 可 以 按 顺序 访问 它们 。 这 个 过 程 产生 我 们 的 第 一 种 搜索 技术 顺序 查 
x o 

Figure 1 展示 了 这 种 搜索 的 工作 原理 。 从 列表 中 的 第 一 个 项 目 开始 ， 我 们 按照 基本 的 顺序 排 
序 ， 简 单 地 从 一 个 项 移动 到 另 一 个 项 ， 直 到 找到 我 们 正在 寻找 的 项 或 遍历 完整 个 列表 。 如 果 
我 们 遍历 完整 个 列表 ， 则 说 明正 在 搜索 的 项 不 存在 。 





Figure 1 


该 算法 的 Python 实现 见 CodeLens 1。 该 函数 需要 一 个 列表 和 我 们 正在 寻找 的 项 作为 参数 ， 
并 返回 一 个 是 否 存在 的 布尔 值 。 found 布尔 变量 初始 化 为 False， 如 果 我 们 发 现 列表 中 的 
项 ， 则 赋值 为 True。 


def sequentialSearch(alist, item): 
pos = 0 
found = False 


while pos < len(alist) and not found: 
if alist[pos] == item: 
found = True 
else: 
pos = pos+1 


return found 
testlist = [1, 2, 32, 8, 17, 19, 42, 13, 0] 


print(sequentialSearch(testlist, 3)) 
print(sequentialSearch(testlist, 13)) 


CodeLens 1 


5.3.1 ERD A 


为 了 分 析 搜索 算法 ， 我 们 需要 定 一 个 基本 计算 单位 。 回 想 一 下 ， 这 通常 是 为 了 解决 问题 要 重 
复 的 共同 步骤 。 对 于 搜索 ， 计 算 比较 操作 数 是 有 意义 的 。 每 个 比较 都 有 可 能 找到 我 们 正在 寻 
找 的 项 目 。 此 外 ， 我 们 在 这 里 做 另 一 个 假设 。 项 列表 不 以 任何 方式 排序 。 项 随机 放置 到 列表 
中 。 换 名 话说 ， 项 在 列表 任何 位 置 的 概率 是 一 样 的 。 


如 果 项 不 在 列表 中 ， 知 道 它 的 唯一 方法 是 将 其 与 存在 的 每 个 项 进行 比较 。 如 果 有 n 个 项 ， 则 顺 
序 查找 需要 n 个 比较 来 发 现 项 不 存在 。 在 项 在 列表 中 的 情况 下 ， 分 析 不 是 那么 简单 。 实 际 上 
有 三 种 不 同 的 情况 可 能 发 生 。 在 最 好 的 情况 下 ， 我 们 在 列表 的 开头 找到 所 需 的 项 ， 只 需要 一 
个 比较 。 在 最 坏 的 情况 下 ， 我 们 直到 最 后 的 比较 才 找 到 项 ， 第 n 个 比较 。 


平均 情况 怎么 样 ?平均 来 说 ， 我 们 会 在 列表 的 一 半 找 到 该 项 ; 也 就 是 说 ， 我们 将 比较 n/2 项 。 
然而 ， 回 想 一 下 ， 当 mn 变 大 时 ， 系 数 ， 无 论 它 们 是 什么 ， 在 我 们 的 近似 中 变 得 不 重要 ， 因 此 
顺序 查找 的 复杂 度 是 O(n)。Table 1 总结 了 这 些 结果 。 


Case Best Case Worst Case Average Case 
r n 
item is present 1 n 3 
item isnot present n n n 
Table 1 


我 们 之 前 假设 ， 我 们 列表 中 的 项 是 随机 放置 的 ， 因 此 在 项 之 间 没 有 相对 顺序 。 如 果 项 以 某 种 
方式 排序 ， 顺 序 查找 会 发 生 什么 ? 我们 能 够 在 搜索 技术 中 取得 更 好 的 效率 吗 ? 


假设 项 的 列表 按 升序 排列 。 如 果 我 们 正在 寻找 的 项 存在 于 列表 中 ， 它 在 mn 个 位 置 中 的 概率 依 
旧 相 同 。 我 们 仍然 会 有 相同 数量 的 比较 来 找到 该 项 。 然 而 ， 如 果 该 项 不 存在 ， 则 有 一 些 优 

点 。Figure 2 展示 了 这 个 过 程 ， 寻 找 项 50。 注 意 ， 项 仍然 按 顺 序 进行 比较 直到 54。 此 时 ， 我 
们 知道 一 些 额 外 的 东西 。 不 仅 54 不 是 我 们 正在 寻找 的 项 ， 也 没有 超过 54 的 其 他 元 素 可 以 匹 
配 到 该 项 ， 因 为 列表 是 有 序 的 。 在 这 种 情况 下 ， 算 法 不 必 继 续 查看 所 有 项 。 它 可 以 立即 停 
sk © CodeLens 2 展示 了 顺序 查找 功能 的 这 种 变化 。 





Figure 2 


def orderedSequentialSearch(alist, item): 
pos = 0 
found = False 
stop = False 
while pos < len(alist) and not found and not stop: 
if alist[pos] == item: 
found = True 
else: 
if alist[pos] > item: 
stop = True 
else: 
pos = pos+1 


return found 
testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42,] 
print(orderedSequentialSearch(testlist, 3)) 
print (orderedSequentialSearch(testlist, 13)) 


CodeLens 2 


Table 2 总 结 了 这 些 结果 。 请 注意 ， 在 最 好 的 情况 下 ， 我 们 通过 只 查看 一 项 会 发 现 该 项 不 在 列 
表 中 。 平均 来 说 ， 我 们 将 只 了 解 n/2 项 就 知道 。 然 而 ， 这 种 复杂 度 仍 然 是 O(n)。 总 之 ， 只 有 
在 我 们 没有 找到 该 项 的 情况 下 ， 才 通过 对 列表 排序 来 改进 顺序 查找 。 


item is present l n 


ID 


item not present 1 n 


tx 


Table 2 


5.4. 二 分 查找 


有 序列 表 对 于 我 们 的 比较 是 很 有 用 的 。 在 顺序 查找 中 ， 当 我 们 与 第 一 个 项 进行 比较 时 ， 如 果 
第 一 个 项 不 是 我 们 要 查找 的 ， 则 最 多 还 有 n-1 个 项 目 。 二 分 查找 从 中 间 项 开始 ， 而 不 是 按 
顺序 查找 列表 。 如 果 该 项 是 我 们 正在 寻找 的 项 ， 我 们 就 完成 了 查找 。 如 果 它 不 是 ， 我 们 可 以 
使 用 列表 的 有 序 性 质 来 消除 剩余 项 的 一 半 。 如 果 我 们 正在 查找 的 项 大 于 中 间 项 ， 就 可 以 消除 
中 间 项 以 及 比 中 间 项 小 的 一 半 元 素 。 如 果 该 项 在 列表 中 ， 肯 定 在 大 的 那 半 部 分 。 


然后 我 们 可 以 用 大 的 半 部 分 重复 这 个 过 程 。 从 中 间 项 开始 ， 将 其 与 我 们 正在 寻找 的 内 容 进行 


比较 。 再 次 ， 我 们 找到 元 素 或 将 列表 分 成 两 半 ， 消 除 可 能 的 搜索 空间 的 另 一 部 分 。Figure 3 
展示 了 该 算法 如 何 快速 找到 值 54 。 完 整 的 函数 见 CodeLens 3 中 。 





Start 


Figure 3 


def binarySearch(alist, item): 
first = 0 
last = len(alist)-1 
found = False 


while first<=last and not found: 

midpoint = (first + last)//2 

if alist[midpoint] == item: 
found = True 

else: 
if item < alist[midpoint]: 

last = midpoint-1 

elise: 


first = midpoint+1 
return found 
testist- I0 1 2, Gy, 13, 17 19 32, 42] 


print(binarySearch(testlist, 3)) 
print(binarySearch(testlist, 13)) 


CodeLens 3 


在 我 们 继续 分 析 之 前 ， 我 们 应 该 注意 到 ， 这 个 算法 是 分 而 治之 策略 的 一 个 很 好 的 例子 。 分 和 
治 意味 着 我 们 将 问题 分 成 更 小 的 部 分 ， 以 某 种 方式 解决 更 小 的 部 分 ， 然 后 重新 组 合 整个 问题 
以 获得 结果 。 当 我 们 执行 列表 的 二 分 查找 时 ， 我 们 首先 检查 中 间 项 。 如 果 我 们 正在 搜索 的 项 
小 于 中 间 项 ， 我 们 可 以 简单 地 对 原始 列表 的 左 半 部 分 执行 二 分 查找 。 同 样 ， 如 果 项 大 ， 我 们 
可 以 执行 右 半 部 分 的 二 分 查找 。 无 论 哪 种 方式 ， 都 是 递归 调用 二 分 查找 函数 。 CodeLens 4 
展示 了 这 个 递归 版 本 。 


def binarySearch(alist, item): 
if len(alist) == 0: 
return False 
elise: 
midpoint = len(alist)//2 
if alist[midpoint]==item: 
return True 
elise: 
if item<alist[midpoint]: 
return binarySearch(alist[:midpoint], item) 
elise: 
return binarySearch(alist [midpoint+1:], item) 


testlist = M0, al, 2 87 13, 17, 19, 32, 42,] 
print(binarySearch(testlist, 3)) 
print(binarySearch(testlist, 13)) 


CodeLens 4 


5.4.1. 二 分 查找 分 析 


为 了 分 析 二 分 查找 算法 ， 我 们 需要 记 住 ， 每 个 比较 消除 了 大 约 一 半 的 剩余 项 。 该 算法 检查 整 
个 列表 的 最 大 比较 数 是 多 少 ? 如 果 我 们 从 n 项 开始 ， 大 约 n/2 项 将 在 第 一 次 比较 后 留 下 。 第 
二 次 比较 后 ， 会 有 约 n/4。 然后 n/8，n/16， 等 等 。 我 们 可 以 拆 分 列表 多 少 次 ? Table 3 帮助 
我 们 找到 答案 。 


Comparisons Approximate Number of Items Left 
n 

i 2 

2 n 
n 

3 8 


Table 3 


当 我 们 切 分 列表 足够 多 次 时 ， 我 们 最 终 得 到 只 有 一 个 项 的 列表 。 要 么 是 我 们 正在 寻找 的 项 ， 
要 么 不 是 。 达 到 这 一 点 所 需 的 比较 数 是 1， 当 n/2^i= 1 时 。 求解 1 得 出 i= log^n 。 最 大 比较 
数 相对 于 列表 中 的 项 是 对 数 的 。 因此， 二 分 查找 是 O(log 人 ^n )。 


还 需要 解决 一 个 额外 的 分 析 问 题 。 在 上 面 所 示 的 递归 解 中 ， 递 归 调 用 ， 


binarySearch(alist[:midpoint],item) 


使 用 切片 运算 符 创建 列表 的 左 半 部 分 ， 然 后 传递 到 下 一 个 调用 (同样 对 于 右 半 部 分 ) 。 我 们 
上 面 做 的 分 析 假 设 切 片 操作 符 是 恒定 时 间 的 。 然 而 ， 我 们 知道 Python 中 的 slice 运算 符 实际 
上 是 O(k)。 这 意味 着 使 用 slice 的 二 分 查找 将 不 会 在 严格 的 对 数 时 间 执 行 。 幸 运 的 是 ， 这 可 以 
通过 传递 列表 连同 开始 和 结束 索引 来 纠正 。 可 以 像 CodeLens 3 中 所 做 的 那样 计算 索引 。 我 
们 将 此 实现 作为 练习 。 


即使 二 分 查找 通常 比 顺序 查找 更 好 ， 但 重要 的 是 要 注意 ， 对 于 小 的 n 值 ， 排 序 的 额外 成 本 可 
能 不 值得 。 事 实 上 ， 我 们 应 该 经 常 考 虑 采取 额外 的 分 类 工作 是 否 使 搜索 获得 好 处 。 如 果 我 们 
可 以 排序 一 次 ， 然 后 查找 多 次 ， 排 序 的 成 本 就 不 那么 重要 。 然 而 ， 对 于 大 型 列表 ， 一 次 排序 
可 能 是 非常 昂贵 ， 从 一 开始 就 执行 顺序 查找 可 能 是 最 好 的 选择 。 


5.5.Hash # 4 


在 前 面 的 部 分 中 ， lee 利用 关于 项 在 集合 中 相对 于 彼此 存储 的 位 置 的 信息 ， 改 进 我 们 的 
搜索 算法 。 例 如 过 知道 列表 是 有 序 的 ， 我 们 可 以 使 用 二 分 查找 在 对 数 时 间 中 搜索 。 在 本 
a a e O(1) 时 间 内 搜索 的 数据 结构 。 这 个 概念 被 称 为 
Hash 查找 ° 


为 了 做 到 这 一 点 ， 当 我 们 在 集合 中 查找 项 时 ， 我 们 需要 更 多 地 了 解 项 可 能 在 哪里 。 如 果 每 个 
项 都 在 应 该 在 的 地 方 ， 那 么 搜索 可 以 使 用 单个 比较 就 能 发 现 项 的 存在 。 然 而 ， 我 们 看 到 ， 通 
常 不 是 这 样 的 。 


哈 希 表 是 以 一 种 容易 找到 它们 的 方式 存储 的 项 的 集合 。 哈 项 表 的 每 个 位 置 ， 通 常 称 为 一 个 
楼 ， 可 以 容纳 一 个 项 ， 并 且 由 从 0 开始 的 整数 值 命名 。 例 如 ， 我 们 有 一 个 名 为 0 tR ZA 
16> ZA 2 的 槽 ， 以 上 。 最 初 ， 哈 希 表 不 包含 项 ， 因 此 每 个 构 都 为 室 。 我 们 可 以 通过 使 
用 列表 来 实现 一 个 哈 希 表 ， 每 个 元 素 初始 化 为 None 。Figure 4 展示 了 大 小 m= 11 OSA 
表 。 换 名 话说 ， 在 表 中 有 m 个 槽 ， 命 名 为 0 到 10。 





Figure 4 


FH Fo THEA RP PB, DZ E A RA AAR A hash Hak 。 hash 函数 将 接收 集合 中 的 任何 
Ho FEMS CAA (04 m-1 之 间 ) 返回 一 个 整数 。 假 设 我 们 有 整数 项 54,26,93,17,77 和 
31 的 集合 。 我 们 的 第 一 个 hash 函数 ， 有 时 被 称 为 余数 法 ， 只 需要 一 个 项 并 将 其 除 以 表 大 
小 ， 返 回 剩余 部 分 作为 其 散 列 值 (h(item) = item%11) ° Table 4 给 出 了 我 们 的 示例 项 的 所 
有 哈 希 值 。 注 意 ， 这 种 余数 方法 (REL) 通常 以 某 种 形式 存在 于 所 有 散 列 函数 中 ， 因 为 结 
果 必 须 在 槽 名 的 范围 内 。 


Item Hash Value 


54 10 

26 4 

93 5 

17 6 

vr 0 

31 9 
Table 4 


一 旦 计算 了 哈 希 值 ， 我 们 可 以 将 每 个 项 插入 到 指定 位 置 的 哈 希 表 中 ， 如 Figure 5 所 示 。 注 
意 ，11 个 插 模 中 的 6 个 现在 已 被 占用 。 这 被 称 为 负载 因子 ， 通 常 表示 为 和 = 项 数 / 表 大 小 ， 在 这 
个 例子 中 ， 入 = 6/11 ° 


0 1 2 3 4 5 6 7 8 9 10 





Figure 5 


现在 ， 当 我 们 要 搜索 一 个 项 时 ， 我 们 只 需 使 用 哈 希 函数 来 计算 项 的 槽 名称， 然后 检查 哈 希 表 
以 查看 它 是 否 存 在 。 该 搜索 操作 是 O(1)， 因 为 需要 恒定 的 时 间 量 来 计算 散 列 值 ， 然 后 在 该 位 
置 索引 散 列 表 。 如 果 一 切 都 正确 的 话 ， 我 们 已 经 找到 了 一 个 恒定 时 间 搜 索 算 法 。 


你 可 能 已 经 看 到 ， 只 有 每 个 项 映射 到 哈 希 表 中 的 唯一 位 置 ， 这 种 技术 才 会 起 作用 。 例 如， 如 
果 项 44 是 我 们 集合 中 的 下 一 个 项 ， 则 它 的 散 列 值 为 o (44%11 == 0) 。 因为 77 的 哈 希 值 也 
是 0， 我 们 会 有 一 个 问题 。 根 据 散 列 函 数 ， 两 个 或 更 多 项 将 需要 在 同一 楼 中 。 这 种 现象 被 称 为 
碰撞 ( 它 也 可 以 被 称 为 "冲突 ") 。 显 然 ， 冲 突 使 散 列 技术 产生 了 问题 。 我 们 将 在 后 面 详细 讨 


论 。 


5.5.1.hash % 4& 


给 定 项 的 集合 ， 将 每 个 项 映射 到 唯一 槽 的 散 列 函 数 被 称 为 完美 散 列 函数 。 如 果 我 们 知道 项 和 
集合 将 永远 不 会 改变 ， 那 么 可 以 构造 一 个 完美 的 散 列 函数 。 不 幸 的 是 ， 给 定 任 意 的 项 集合 ， 
没有 系统 的 方法 来 构建 完美 的 散 列 函数 。 幸 运 的 是 ， 我 们 不 需要 散 列 函数 是 完美 的 ， 仍 然 可 
以 提高 性 能 。 


总 是 具有 完美 散 列 函数 的 一 种 方式 是 增加 散 列表 的 大 小 ， 使 得 可 以 容纳 项 范围 中 的 每 个 可 能 
值 。 这 保证 每 个 项 将 具有 唯一 的 构 。 虽 然 这 对 于 小 数目 的 项 是 实用 的 ， 但 是 当 可 能 项 的 数目 
大 时 是 不 可 行 的 。 例 如 ， 如 果 项 是 九 位 数 的 社保 号 码 ， 则 此 方法 将 需要 大 约 十 亿 个 楼 。 如 果 
我 们 只 想 存 储 25 名 学 生 的 数据 ， 我 们 将 浪费 大 量 的 内 存 。 


我 们 的 目标 是 创建 一 个 散 列 函数 ， 最 大 限度 地 减少 冲突 数 ， 易 于 计算 ， 并 均匀 分 布 在 哈 希 表 
中 的 项 。 有 很 多 常用 的 方法 来 扩展 简单 余数 法 。 我 们 将 在 这 里 介绍 其 中 几 个 。 


分 组 求 和 法 将 项 划分 为 相等 大 小 的 块 (最 后 一 块 可 能 不 是 相等 大 小 ) 。 然 后 将 这 些 块 加 在 一 起 
以 求 出 散 列 值 。 例 如 ， 如 果 我 们 的 项 是 电话 号 码 436-555-4601 ， 我 们 将 取出 数字 ， 并 将 它们 
分 成 2 位 数 (43,65,55,46,01) ° 43 + 65 + 55 + 46 + 01 ， 我 们 得 到 210。 我 们 假设 哈 希 表 
有 11 个 槽 ， 那 么 我 们 需要 除 以 11 。 在 这 种 情况 下 ，216%11 为 1， 因 此 电话 号 码 436-555- 
4601 KIAI 1。 一 些 分 组 求 和 法 会 在 求 和 之 前 每 隔 一 个 反 转 。 对 于 上 述 示例 ， 我 们 得 到 

43 + 56 + 55 + 64 + 01 = 219 ° 2E 219%11 = 10 ° 

用 于 构造 散 列 函数 的 另 一 数值 技术 被 称 为 平方 取 中 法 。 我 们 首先 对 该 项 平方 ， 然 后 提取 一 部 分 
数字 结果 。 例 如 ， 如 果 项 是 44， 我 们 将 首先 计算 44^2 = 1,936 。 通 过 提取 中 间 两 个 数字 

93 ， 我 们 得 到 5 (93%11) ° Table 5 展示 了 余数 法 和 中 间 平 方法 下 的 项 。 


Item Remainder Mid-Square 
54 10 3 
26 4 7 
93 5 9 
17 6 8 
77 0 4 
31 9 6 
Table 5 


我 们 还 可 以 为 基于 字符 的 项 (如 字符 囊 ) 创建 哈 希 函数 。 词 cat 可 以 被 认为 是 ascii 值 的 序 
列 o 

>>> ord('c') 

>>> ord('a') 


>>> ord('t') 


然后 ， 我 们 可 以 获取 这 三 个 ascii 值 ， 将 它们 相 加 ， 并 使 用 余数 方法 获取 散 列 值 (参见 Figure 
6) ° Listing 1 展示 了 一 个 名 为 hash 的 函数 ， 它 接收 字符 串 和 表 大 小 作为 参数 ， 并 返回 从 
0 到 tablesize-1 的 范围 内 的 散 列 值 。 


Item Remainder Mid-Square 
54 10 3 
26 4 7 
93 5 9 
17 6 8 
77 0 4 
31 9 6 
Figure 6 


def hash(astring, tablesize): 
sum = 0 
for pos in range(len(astring) ): 
sum = sum + ord(astring[pos] ) 


return sum%tablesize 


Listing 1 


有 趣 的 是 ， 当 使 用 此 散 列 函 数 时 ， 字 符 串 总 是 返回 相同 的 散 列 值 。 为 了 弥补 这 一 点 ， 我 们 可 
以 使 用 字符 的 位 置 作为 权重 。Figure 7 展示 了 使 用 位 置 值 作为 加 权 因 子 的 一 种 可 能 的 方式 。 


position 


1 2 3 
c a t 
9921 + 9742 + 116*3 = 641 


641 % = 3 


Figure 7 


你 可 以 思考 一 些 其 他 方法 来 计算 集合 中 项 的 散 列 值 。 重 要 的 是 要 记 住 ， 哈 硕 函 数 必 须 是 高 效 
的 ， 以 便 它 不 会 成 为 存储 和 搜索 过 程 的 主要 部 分 。 如 果 哈 希 函 数 太 复杂 ， 则 计算 档 名 称 的 程 
序 要 上 比 之 前 所 述 的 简单 地 进行 基本 的 顺序 或 二 分 搜索 更 耗 时 。 这 将 打破 散 列 的 目的 。 


5.5.2. 冲 突 解决 


我 们 现在 回 到 碰撞 的 问题 。 当 两 个 项 散 列 到 同一 个 楷 时 ， 我 们 必须 有 一 个 系统 的 方法 将 第 二 
个 项 放 在 散 列 表 中 。 这 个 过 程 称 为 冲突 解决 。 如 前 所 述 ， 如 果 散 列 函 数 是 完美 的 ， 冲 突 将 永 
远 不 会 发 生 。 然 而 ， 由 于 这 通常 是 不 可 能 的 ， 所 以 冲突 解决 成 为 散 列 非常 重要 的 部 分 


解决 冲突 的 一 种 方法 是 查找 散 列 表 ， 尝 试 查找 到 另 一 个 空 槽 以 保存 导致 冲突 的 项 。 一 个 简单 
的 方法 是 从 原始 哈 希 值 位 置 开始 ， 然 后 以 顺序 方式 移动 楷 ， 直 到 遇 到 第 一 个 空 楷 。 注 意 ， 我 
们 可 能 需要 回 到 第 一 个 档 (循环 ) 以 查找 整个 散 列表 。 这 种 冲突 解决 过 程 被 称 为 开放 了 寻 址 ， 
因为 它 试图 在 散 列 表 中 找到 下 一 个 空 模 或 地 址 。 通 过 系统 地 一 次 访问 每 个 模 ， 我 们 执行 称 为 
线性 探测 的 开放 寻 址 技术 。 


Figure 8 展示 了 在 简单 余数 法 散 列 函数 (54,26,93,17,77,31,44,55,20) 下 的 整数 项 的 扩展 集 
合 。 上 面 的 Table 4 展示 了 原始 项 的 哈 希 值 。Figure 5 展示 了 原始 内 容 。 当 我 们 尝试 将 44 
放 入 槽 0 时 ， 发 生 冲 突 。 在 线性 探测 下 ， 我 们 逐个 顺序 观察 ， 直 到 找到 位 置 。 在 这 种 情况 
下 ， 我 们 找到 槽 1。 


再 次 ，55 应 该 在 档 0 中 ， 但 是 ee 2 中 ， 因 为 它 是 下 一 个 开放 位 置 。 值 20 HF! 
BRE 9 °- THO 已 满 ， 我 们 进行 线性 探测 。 我 们 访问 模 10,0,1 和 2 ， 最 后 在 位 置 3 找到 





Figure 8 


一 旦 我 们 使 用 开放 寻 址 和 线性 探测 建立 了 哈 希 表 ， 我 们 就 必须 使 用 相同 的 方法 来 搜索 项 。 假 
设 我 们 想 查找 项 93 。 当 我 们 计算 哈 希 值 时 ， 我 们 得 到 5 co BAW SHE 93 ， 返 回 
True。 如 果 我 们 正在 寻找 20 ， 现 在 哈 希 值 为 9 °R 9 当前 项 为 31 。 我 们 不 能 简单 
地 返回 False， 因 为 我 们 知道 可 能 存在 冲突 。 我 们 现在 被 迫 做 一 个 顺序 搜索 ， 从 位 置 10 H 
始 寻 找 ， 直 到 我 们 找到 项 26 或 我 们 找到 一 个 空 槽 。 


线性 探测 的 缺点 是 聚集 的 趋势 ;项 在 表 中 聚集 。 这 意味 着 如 果 在 相同 的 散 列 值 处 发 生 很 多 冲 
突 ， 则 将 通过 线性 探测 来 填充 多 个 周边 楷 。 这 将 影响 正在 插入 的 其 他 项 ， 正 如 我 们 尝试 添加 
上 面 的 项 20 时 看 到 的 。 必 须 跳 过 一 组 值 为 o 的 值 ， 最 终 找 到 开放 位 置 。 该 聚集 如 Figure 
9 所 示 。 
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Figure 10 





在 冲突 后 寻找 另 一 个 福 的 过 程 叫 重新 散 列 。 使 用 简单 的 线性 探测 ，rehash 函数 是 
newhashvalue = rehash(oldhashvalue) 其 中 rehash(pos)=(pos + 1)%sizeoftable 。 加 

3 rehash 可 以 定义 为 rehash(pos)=(pos + 3)%sizeoftable 。 一 般 来 说 ， rehash(pos)=(pos + 
skip)%sizeoftable 。 重 要 的 是 要 注意 ，“ 跳 过 ”的 大 小 必须 使 得 表 中 的 所 有 槽 最 终 都 被 访问 。 
否则 ， 表 的 一 部 分 将 不 被 使 用 。 为 了 确保 这 一 点 ， 通 常 建议 表 大 小 是 素数 。 这 是 我 们 在 示例 
中 使 用 11 的 原因 。 


线性 探测 思想 的 一 个 变种 称 为 二 次 探测 。 代 替 使 用 常量 “ 跳 过 ” 值 ， 我 们 使 用 rehash 函数 ， 将 
散 列 值 递增 1,3:,5,7,9， 依 此 类 推 。 这 意味 着 如 果 第 一 哈 希 值 是 hn ， 则 连续 值 是 h + 1， 
h+4°h+9°h+16 ， 等 等 。 换 和 句 话 说， 二 次 探测 使 用 由 连续 完全 正方 形 组 成 的 跳跃 。 
Figure 11 展示 了 使 用 此 技术 放置 之 后 的 示例 值 。 
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Figure 11 





用 于 处 理 冲 突 问题 的 蔡 代 方法 是 允许 每 个 槽 保持 对 项 的 集合 〈 或 链 ) 的 引用 。 链 接 允 许 许 多 
项 存在 于 哈 希 表 中 的 相同 位 置 。 当 发 生 冲 突 时 ， 项 仍然 放 在 散 列表 的 正确 楷 中 。 随 着 越 来 越 
多 的 项 哈 希 到 相同 的 位 置 ， 搜 索 集合 中 的 项 的 难度 增加 。 Figure 12 展示 了 添加 到 使 用 链接 解 


决 冲突 的 散 列 表 时 的 项 。 
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Figure 12 


当 我 们 要 搜索 一 个 项 时 ， 我 们 使 用 散 列 函 数 来 生成 它 应 该 在 的 模 。 由 于 每 个 楷 都 有 一 个 集 
合 ， 我 们 使 用 一 种 搜索 技术 来 查找 该 项 是 否 存 在 。 优 点 是 ， 平 均 来 说 ， 每 个 档 中 可 能 有 更 少 
的 项 ， 因 此 搜索 可 能 更 有 效 。 我 们 将 在 本 节 结 尾 处 查看 散 列 的 分 析 。 


5.5.3. 实 现 map 抽象 数据 类 型 


最 有 用 的 Python 集合 之 一 是 字典 。 nee P 典 是 一 种 关联 数据 类 型 ， 你 可 以 在 其 中 存储 
键 - 值 对 。 该 键 用 于 查找 关联 的 值 。 我 们 经 常 个 想法 称 为 map 。 


map 抽象 数据 类 型 定义 如 下 。 该 结构 是 键 与 值 之 间 的 关联 的 无 序 集合 。map 中 的 键 都 是 唯一 


的 ， 


e in 


因此 键 和 值 之 间 存 在 一 对 一 的 关系 。 操 作 如 下 。 


Map() 创建 一 个 新 的 map 。 它 返回 一 个 空 的 map 集合 。 

put(key > val) 向 map 中 添加 一 个 新 的 键 值 对 。 如 果 键 已 经 在 map 中 ， 那 么 用 新 值 替换 
旧 值 。 

get(key) 给 定 一 个 键 ， 返 回 存储 在 map 中 的 值 或 None。 

del 使 用 del map[key] 形式 的 语句 从 map 中 删除 键 值 对 。 

len() 返回 存储 在 map 中 的 键 值 对 的 数量 。 

返回 True 对 于 key in map 语句 ， 如 果 给 定 的 键 在 map Y > FM A False 。 


字典 一 个 很 大 的 好 处 是 ， 给 定 一 个 键 ， 我 们 可 以 非常 快速 地 查找 相关 的 值 。 为 了 提供 这 种 快 
速 查找 能 力 ， AER — ASS 效 搜索 的 实现 。 我 们 可 以 使 用 具有 顺序 或 二 分 查找 的 列 


表 ， 


但 是 使 用 如 上 所 述 的 哈 希 表 将 更 好 ， 因 为 查找 哈 希 表 中 的 项 可 以 接近 O(1) 性 能 。 


在 Listing 2 中 ， 我 们 使 用 两 个 列表 来 创建 一 个 实现 Map 抽象 数据 类 型 的 HashTable 类 。 一 个 
名 为 slots 的 列表 将 保存 键 项 ， 一 个 称 data 的 并 行列 表 将 保存 数据 值 。 当 我 们 查找 一 个 

键 时 ， data 列表 中 的 相应 位 置 将 保存 相关 的 数据 值 。 我 们 将 使 用 前 面 提出 的 想法 将 键 列 表 

视 为 哈 希 表 。 注 意 ， 哈 希 表 的 初始 大 小 已 经 被 选择 为 11。 尽 管 这 是 任意 的 ， 但 是 重要 的 是 ， 

大 小 是 质数 ， 使 得 冲突 解决 算法 可 以 尽 可 能 高 效 。 


class HashTable: 
def init__(self): 
self.size = 11 
self.slots = [None] * self.size 
self.data = [None] * self.size 


Listing 2 


hash 函数 实现 简单 的 余数 方法 。 冲 突 解决 技术 是 加 1 rehash 函数 的 线性 探测 。 put 函数 

( 见 Listing 3) 假定 最 终 将 有 一 个 空 楷 ， 除 非 key 已 经 存在 于 self.slots Po 它 计 算 原 始 
哈 希 值 ， 如 果 该 槽 不 为 室 ， 则 和 迭代 rehash HA > BF) HHL o toRGES MLAS key? 
则 昌 数 据 值 将 替换 为 新 数据 值 。 


def put(self,key,data): 
hashvalue = self.hashfunction(key, len(self.slots) ) 


if self.slots[hashvalue] == None: 
self.slots[hashvalue] = key 
self.data[hashvalue] = data 
else: 
if self.slots[hashvalue] == key: 
self.data[hashvalue] = data #replace 
elise: 
nextslot = self.rehash(hashvalue, len(self.slots) ) 
while self.slots[nextslot] != None and \ 
self.slots[nextslot] != key: 
nextslot = self.rehash(nextslot, len(self.slots) ) 


if self.slots[nextslot] == None: 
self.slots[nextslot ]=key 
self .data[nextslot ]=data 

else: 
self.data[nextslot] = data #replace 


def hashfunction(self,key,size): 
return key%size 


def rehash(self,oldhash, size): 
return (oldhash+i)%size 


Listing 3 


同样 ，get BA (J Listing 4) 从 计算 初始 哈 希 值 开始 。 如 果 值 不 在 初始 槽 中 ， 则 rehash 用 
于 定位 下 一 个 可 能 的 位 置 。 注 意 ， 第 15 行 保证 搜索 将 通过 检查 以 确保 我 们 没有 返回 到 初始 模 
来 终止 。 如 果 发 生 这 种 情况 ， 我 们 已 用 尽 所 有 可 能 的 档 ， 并 且 项 不 硝 在 。 


HashTable 类 提供 了 附加 的 字典 功能 。 我 们 重 载 getitem fe setitem ”方法 以 允许 使 
用 [] 访问 。 这 意味 着 一 旦 创建 了 HashTable， 农 引 操作 符 将 可 用 。 


def get(self,key): 
startslot = self.hashfunction(key, len(self.slots)) 


data = None 
stop = False 
found = False 
position = startslot 
while self.slots[position] != None and \ 
not found and not stop: 
if self.slots[position] == key: 
found = True 
data = self.data[position] 
else: 
position=self.rehash(position, len(self.slots) ) 
if position == startslot: 
stop = True 
return data 


def _ getitem (self, key): 
return self.get(key) 


def _ setitem (self, key, data): 
self.put(key, data) 
Listing 4 


下 面 的 会 话 展示 了 HashTable 类 的 操作 。 首 先 ， 我 们 将 创建 一 个 哈 希 表 并 存储 一 些 带 有 整数 
键 和 字符 串 数 据 值 的 项 。 


>>> H=HashTable() 

>>> H[54]="cat" 

>>> H[26]="dog" 

>>> H[93]="lion" 

>>> H[17]="tiger" 

>>> H[77]="bird" 

>>> H[31]="cow" 

>>> H[44]="goat" 

>>> H[55]="pig" 

>>> H[20]="chicken" 

>>> H.slots 

[77, 44, 55, 20, 26, 93, 17, None, None, 31, 54] 

>>> H.data 

['bird', 'goat', 'pig', 'chicken', 'dog', ‘lion', 
"tiger', None, None, 'cow', 'cat'] 


接 下 来 ， 我 们 将 访问 和 修改 哈 希 表 中 的 一 些 项 。 注 意 ， 正 替换 键 20 的 值 。 


>>> H[20] 

"chicken' 

>>> H[17] 

"tiger' 

>>> H[20]='duck' 

>>> H[20] 

"duck' 

>>> H.data 

['bird', 'goat', 'pig', 'duck', dogi, ‘lion', 
"tiger', None, None, 'cow', 'cat'] 

>> print(H[99]) 

None 


5.5.4.hash 法 分 析 


我 们 之 前 说 过 ， 在 最 好 的 情况 下 ， 散 列 将 提供 O(1)， 恒 定时 间 搜索 。 然 而 ， 由 于 冲突 ， 比 较 
的 数量 通常 不 是 那么 简单 。 即 使 对 散 列 的 完整 分 析 超 出 了 本 文 的 范围 ， 我 们 可 以 陈述 一 些 近 
似 搜索 项 所 需 的 比较 数量 的 已 知 结果 。 


我 们 需要 分 析 散 列表 的 使 用 的 最 重要 的 信息 是 负载 因子 入。 概念 上 ， 如 果 入 小 ， 则 碰撞 的 机 会 
较 低 ， 这 意味 着 项 更 可 能 在 它们 所 属 的 模 中 。 如 果 入 大， 意味 着 表 正 在 填 满 ， 则 存在 越 来 越 
多 的 冲突 。 这 意味 着 冲突 解决 更 困难 ， 需 要 更 多 的 比较 来 找到 一 个 空 楷 。 使 用 链接 ， 增 加 的 
碰撞 意味 着 每 个 链 上 的 项 数量 增加 。 


和 以 前 一 样 ， 我 们 将 有 一 个 成 功 的 搜索 结果 和 不 成 功 的 。 对 于 使 用 具有 线性 探测 的 开放 寻 址 
的 成 功 搜索 ， 平 均 比较 数 大 约 为 1/2 (1 + 17(1-A)) ， 不 成 功 的 搜索 为 112(1+(1/1-A)^2 ) 如 果 
我 们 使 用 链接 ， 则 对 于 成 功 的 情况 ， 平 均 比较 数目 是 1+M2， 如 果 搜 索 不 成 功 ， 则 简单 地 是 入 
比较 次 数 。 


5.5.Hash 查 找 
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5.6. 排 序 


排序 是 以 某 种 顺序 从 集合 中 放置 元 素 的 过 程 。 例 如 ， 单 词 列 表 可 以 按 字母 顺序 或 按 长 度 排 
序 。 城 市 列表 可 按 人 口 ， 按 地 区 或 邮政 编码 排序 。 我 们 已 经 看 到 了 许多 能 够 从 排序 列表 中 获 
益 的 算法 (回忆 之 前 的 回 文 例子 和 二 分 查找 ) © 


有 许多 开发 和 分 析 的 排序 算法 。 表 明 排序 是 计算 机 科学 的 一 个 重要 研究 领域 。 对 大 量 项 进行 
排序 可 能 需要 大 量 的 计算 资源 。 与 搜索 一 样 ， 排 序 算法 的 效率 与 正在 处 理 的 项 的 数量 有 关 。 
对 于 小 集合 ， 复 杂 的 排序 方法 可 能 更 麻烦 ， 开 销 太 高 。 另 一 方面 ， 对 于 更 大 的 集合 ， 我 们 希 
望 利 用 尽 可 能 多 的 改进 。 在 本 节 中 ， 我 们 将 讨论 几 种 排序 技术 ， 并 对 它们 的 运行 时 间 进 行 比 


较 。 


在 分 析 特 定 算法 之 前 ， 我 们 应 该 考虑 可 用 于 分 析 排 序 过 程 的 操作 。 首 先 ， 必须 比较 两 个 值 以 
查看 哪个 更 小 (或 更 大 ) 。 为 了 对 集合 进行 排序 ， 需 要 一 些 系统 的 方法 来 比较 值 ， 以 查看 是 
和 否 有 问题 。 比 较 的 总 数 将 是 测量 排序 过 程 的 最 常见 方法 。 第 二 ， 当 值 相对 于 彼此 不 在 正确 的 
位 置 时 ， 可 能 需要 交换 它们 。 这 种 交换 是 一 种 兄 贵 的 操作 ， 并 且 交 换 的 总 数 对 于 评估 算法 的 
整体 效率 也 将 是 很 重要 的 。 


5.7. 冒 泡 排序 


冒 泡 排序 需要 多 次 遍历 列表 。 它 比较 相 邻 的 项 并 交换 那些 无 序 的 项 。 每 次 遍历 列表 将 下 一 个 
最 大 的 值 放 在 其 正确 的 位 置 。 实 质 上 ， 每 个 项 “ 冒 泡 ? 到 它 所 属 的 位 置 。 


Figure 1 展示 了 冒 泡 排序 的 第 一 次 遍历 。 阴 影 项 正在 比较 它们 是 否 乱 序 。 如 果 在 列表 中 有 nN 
个 项 目 ， 则 第 一 遍 有 n-1 个 项 需要 比较 。 重 要 的 是 要 注意 ， 一 旦 列表 中 的 最 大 值 是 一 个 对 的 
一 部 分 ， 它 将 不 断 地 被 移动 ， 直 到 遍历 完成 。 


First pass 
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Figure 1 

在 第 二 次 遍历 的 开始 ， 现 在 最 大 的 值 已 经 在 正确 的 位 置 。 有 n-1 个 项 留 下 排序 ， 意 味 着 将 有 
n-2 对 。 由 于 每 次 通过 将 下 一 个 最 大 值 放置 在 适当 位 置 ， 所 需 的 遍历 的 总 数 将 是 n-1。 在 完成 
n-1 遍 之 后 ， 最 小 的 项 肯定 在 正确 的 位 置 ， 不 需要 进一步 处 理 。 ActiveCode 1 显示 完整 的 
bubblesort 函数 。 它 将 列表 作为 参数 ， 并 根据 需要 交换 项 来 修改 它 。 

交换 操作 ， 有 时 称 为 swap ， 在 Python 中 与 在 大 多 数 其 他 编程 语言 略 有 不 同 。 通 常 ， 交 换 列 
表 中 的 两 个 元 素 需 要 临时 存储 位 置 (额外 的 内 存 位 置 ) 。 代码 片段 如 下 
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temp = alist[i] 
alist[i] = alist[j] 
alist[j] = temp 


将 交换 列表 中 的 第 i 项 和 第 j 项。 没有 临时 存储 ， 其 中 一 个 值 将 被 覆盖 。 

在 Python 中 ， 可 以 执行 同时 赋值 。 语 多 arb = b'a 两 个 赋值 语句 同时 完成 (参见 Figure 
2) 。 使 用 同时 分 配 ， 交 换 操作 可 以 在 一 个 语句 中 完成 。 

ActiveCode 1 中 的 行 5-7 使 用 先前 描述 的 三 步 过 程 执 行 i 和 第 i+ 1 个 项 的 交换 。 注意 ， 我 们 
也 可 以 使 用 同时 分 配 来 交换 项 目 。 


Most programming languages require a 3-step 
process with an extra storage location. 





In Python, exchange can be done as 
two simultaneous assignments. 


Figure 2 


def bubbleSort(alist): 
for passnum in range(len(alist)-1,0,-1): 
for i in range(passnum): 
if alist[i]>alist[it+1]: 
temp = alist[i] 
alist[i] = alist[i+1] 
alist[it+ti] = temp 


alist = [54,26,93,17,77,31, 44,55, 20] 


bubbleSort(alist) 
print(alist) 


ActiveCode 1 


为 了 分 析 气 泡 排序 ， 我 们 应 该 注意 ， 不 管 项 如 何在 初始 列表 中 排列 ， 将 进行 n-1 次 遍历 以 排 
序 大 小 为 n 的 列表 。 Figure 1 展示 了 每 次 通过 的 比较 次 数 。 比 较 的 总 数 是 第 n-1 个 整数 的 

和 。 回 想起 来 ， 前 n 个 整数 的 和 是 1/2n^2+ 1/2n。 第 n-1 个 整数 的 和 为 1/2n^2 + 1/2n -n ° 
其 为 1/2n^2 - 1/2n 。 这 仍然 是 O(n^2 ) 比较 。 在 最 好 的 情况 下 ， 如 果 列 表 已 经 排序 ， 则 不 会 
进行 交换 。 但是， 在 最 坏 的 情况 下 ， 每 次 比较 都 会 导致 交换 元 素 。 平均 来 说 ， 我 们 交换 了 一 
半 时 间 。 


Pass Comparisons 
1 n-1l 
2 n—-2 
3 n—-3 
n-1 1 
Table1 


冒 泡 排序 通常 被 认为 是 最 低 效 的 排序 方法 ， 因 为 它 必 须 在 最 终 位 置 被 知道 之 前 交换 项 。 这 
些 " 浪 费 " 的 交换 操作 是 非常 昂贵 的 。 然而， 因为 冒 泡 排 序 遍历 列表 的 整个 未 排序 部 分 ， 它 有 
能 力 做 大 多 数 排序 算法 不 能 做 的 事情 。 特 别 地 ， 如 果 在 遍历 期 间 没 有 交换 ， 则 我 们 知道 该 列 
表 已 排序 。 如 果 发 现 列表 已 排序 ， 可 以 修改 冒 泡 排 序 提前 停止 。 这 意味 着 对 于 只 需要 遍历 几 
次 列表 ， 冒 泡 排 序 具有 识别 排序 列表 和 停止 的 优点 。ActiveCode 2 展示 了 这 种 修改 ， 通 常 称 
为 ” 短 冒 泡 排序 © 


def shortBubbleSort(alist): 
exchanges = True 
passnum = len(alist)-1 
while passnum > 0 and exchanges: 
exchanges = False 
for i in range(passnum): 
if alist[i]>alist[i+1]: 
exchanges = True 
temp = alist[i] 
alist[i] = alist[i+1] 
alist[it+1] = temp 
passnum = passnum-1 


alist=[20, 30, 40, 90,50, 60, 70, 80,100, 110] 


shortBubbleSort (alist) 
print(alist) 


Activecode 2 


5.7. 冒 泡 排 序 
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5.8. 选 择 排 序 


选择 排序 改进 了 冒 泡 排序 ， 每 次 遍历 列表 只 做 一 次 交换 。 为 了 做 到 这 一 点 ， 一 个 选择 排序 在 
他 遍历 时 寻找 最 大 的 值 ， 并 在 完成 遍历 后 ， 将 其 放置 在 正确 的 位 置 。 与 冒 泡 排序 一 样 ， 在 第 
一 次 遍历 后 ， 最 大 的 项 在 正确 的 地 方 。 第 二 遍 后 ， 下 一 个 最 大 的 就 位 。 遍 历 n-1 次 排序 nm 个 
项 ， 因 为 最 终 项 必须 在 第 (n-1) 次 遍历 之 后 。 


Figure 3 展示 了 整个 排序 过 程 。 在 每 次 遍历 时 ， 选 择 最 大 的 剩余 项 ， 然 后 放置 在 其 适当 位 
置 。 第 一 遍 放 置 93， 第 二 遍 放置 77， 第 三 遍 放 置 55 等 。 该 函数 展示 在 ActiveCode 1 中。 


stays in place 
list is sorted 
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def selectionSort(alist): 
for fillslot in range(len(alist)-1,09,-1): 
positionOfMax=0 
for location in range(i, fillslot+1): 
if alist[location]>alist[positionOfMax]: 
positionOfMax = location 


temp = alist[fillslot] 
alist[fillslot] = alist[positionOfMax] 
alist[positionOfMax] = temp 


alist = [54,26,93,17,77,31, 44,55, 20] 
selectionSort(alist) 
print(alist) 


可 能 会 看 到 选择 排序 与 冒 泡 排序 有 相同 数量 的 比较 ， 因 此 也 是 O(n^2 )。 然而 ， 由 于 交换 数 


a) ROAM ABA ES AIRE BL ATANNAR 
0 次 交换 ， 而 选择 排序 只 有 8 次 。 


冒 泡 排序 有 


5.9. 插 入 排序 


5.9. 插 入 排序 


插入 排序 ， 尽 管 仍然 是 O(n^2 )， 工 作 方式 略 有 不 同 。 它 始终 在 列表 的 较 低 位 置 维护 一 个 排序 
的 子 列表 。 然 后 将 每 个 新 项 “插入 ” 回 先 前 的 子 列表 ， 使 得 排序 的 子 列表 称 为 较 大 的 一 个 项 。 
Figure 4 展示 了 插入 排序 过 程 。 阴 影 项 表示 算法 进行 每 次 遍历 时 的 有 序 子 列表 。 


p54] 26 | 93 | a7 | 77 | a | a4 | 55 | 20 | Assume 54 is a sorted 

list of 1 item 
EE sl) ~ 
BEE) ~ 
EE LL) ~ 
BEREE) e 
PPP) ee 
EREE) ee 
ERRE) 一 
EE ~~» 


Figure 4 


我 们 开始 假设 有 一 个 项 (位 置 0 ) 的 列表 已 经 被 排序 。 在 每 次 遍历 时 ， 对 于 每 个 项 1 至 n-1， 
将 针对 已 经 排序 的 子 列表 中 的 项 检查 当前 项 。 当 我 们 回顾 已 经 排序 的 子 列 表 时 ， 我 们 将 那些 
更 大 的 项 移动 到 右边 。 当 我 们 到 达 较 小 的 项 或 子 列表 的 末尾 时 ， 可 以 插入 当前 项 。 


Figure 5 详细 展示 了 第 五 次 遍历 。 在 该 算法 中 的 这 一 点 ， 存 在 由 17,26,54,77 和 93 组 成 的 
五 个 项 的 排序 子 列表 。 我 们 插入 31 到 已 经 排序 的 项 。 第 一 次 与 93 比较 导致 93 向 右 移 位 。 
77 和 54 也 移 位 。 当 遇 到 26 时 ， 移 动 过 程 停止 ， 并 且 31 被 置 于 开放 位 置 。 现 在 我 们 有 一 个 
六 个 项 的 排序 子 列表 。 
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Need to insert 31 
back into the sorted list 


93>31 so shift it 
to the right 


77>31 so shift it 
to the right 


54>31 so shift it 
to the right 


in this position 





Figure 5 

insertSort (ActiveCode1) 的 实现 展示 了 存在 n-1 个 遍历 以 对 mn 个 排序 。 从 位 置 1 开始 和 迭 
代 并 移动 位 置 到 n-1， 因 为 这 些 是 需要 插 回 到 排序 子 列表 中 的 项 。 第 8 行 执行 移 位 操作 ， 将 值 
向 上 移动 到 列表 中 的 一 个 位 置 ， 在 其 后 插入 。 请 记 住 ， 这 不 是 像 以 前 的 算法 中 的 完全 交换 。 
插入 排序 的 最 大 比较 次 数 是 n-1 个 整数 的 总 和 。 同 样 ， 是 O(n^2 )。 然 而 ， 在 最 好 的 情况 下 ， 
每 次 通过 只 需要 进行 一 次 比较 。 这 是 已 经 排序 的 列表 的 情况 。 

关于 移 位 和 交换 的 一 个 注意 事项 也 很 重要 。 通 常 ， 移 位 操作 只 需要 交换 大 约 三 分 之 一 的 处 理 
工作 ， 因 为 仅 执行 一 次 分 配 。 在 基准 研究 中 ， 插 入 排序 有 非常 好 的 性 能 。 


def insertionSort(alist): 
for index in range(i,len(alist)): 


currentvalue = alist[index] 
position = index 


while position>0 and alist[position-1]>currentvalue: 
alist[position]=alist[position-1] 
position = position-1 
alist [position]=currentvalue 
alist = [54,26,93,17,77,31, 44,55, 20] 


insertionSort(alist) 
print(alist) 


ActiveCode 1 


5.9. 插 入 排序 
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A 2, dp Ss 
5.10.77 RHA 


5.10.7 RHF 
希 尔 排序 (有 时 称 为 “递减 递增 排序 ") 通过 将 原始 列表 分 解 为 多 个 较 小 的 子 列表 来 改进 插入 排 
序 ， 每 个 子 列 表 使 用 插入 排序 进行 排序 。 选择 这 些 子 列 表 的 方式 是 希 尔 排序 的 关键 。 不 是 将 


列表 拆 分 为 连续 项 的 子 列表 ， 项 尔 排 序 使 用 增 量 i (有 时 称 为 gap) ， 通 过 选择 i 个 项 的 所 有 
项 来 创建 子 列表 。 


这 可 以 在 Figure 6 中 看 到 。 该 列表 有 九 个 项 。 如 果 我 们 使 用 三 的 增 量 ， 有 三 个 子 列表 ， 每 个 
子 列表 可 以 通过 插入 排序 进行 排序 。 完 成 这 些 排序 后 ， 我 们 得 到 如 Figure 7 所 示 的 列表 。 虽 
然 这 个 列表 没有 完全 排序 ， 但 发 生 了 很 有 趣 的 事情 。 通过 排序 子 列表 ， 我 们 已 将 项 目 移 动 到 
更 接近 他 们 实际 所 属 的 位 置 。 


EEEE ee 
BPP BT By): 
BPP BB IM 


sublist 1 sorted 
sublist 2 sorted 


sublist 3 sorted 





after sorting sublists 
at increment 3 





PP PEE PEEL 


Figure 6-7 


Figure 8 展示 了 使 用 增 量 为 1 的 插入 排序 ; 换 句 话说， 标准 插入 排序 。 注 意 ， 通 过 执行 之 前 的 
子 列 表 排 序 ， 我 们 减少 了 将 列表 置 于 其 最 终 顺 序 所 需 的 移 位 操作 的 总 数 。 对 于 这 种 情况 ， 我 
们 只 需要 四 次 移 位 完成 该 过 程 。 


162 


5.10. 希 尔 排 序 


CE PEE EEE} ae 
E 
EELEE Eee 


EELEE e 
CE 
PP EP EEE 


Figure 8 


PPP PEP EES 
BPP EL) 
CP BP 1) 
GP Ee PT EL) 


Figure 9 


我 们 之 前 说 过 ， 增 量 的 选择 方式 是 希 尔 排序 的 独特 特征 。 ActiveCode 1 中 展示 的 函数 使 用 不 
同 的 增 量 集 。 在 这 种 情况 下 ， 我 们 从 n/2 子 列 表 开 始 。 下 一 次 ，n/4 子 列表 排序 。 最后， 单个 
列表 按照 基本 插入 排序 进行 排序 。 Figure 9 展示 了 我 们 使 用 此 增 量 的 示例 的 第 一 个 子 列表 。 
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def shellSort(alist): 
sublistcount = len(alist)//2 
while sublistcount > 0: 


for startposition in range(sublistcount): 
gapInsertionSort(alist,startposition, sublistcount ) 


print("After increments of size",sublistcount, 


"The list is",alist) 
sublistcount = sublistcount // 2 


def gapInsertionSort(alist, start, gap): 


for i in range(start+gap, len(alist),gap): 


currentvalue = alist[i] 
position = i 


while position>=gap and alist[position-gap]>currentvalue: 
alist[position]=alist[position-gap] 
position = position-gap 


alist[position]=currentvalue 


alist = [54,26,93,17,77,31, 44,55, 20] 
shellSort(alist) 
print(alist) 


Activecode 1 


乍 一 看 ， 你 可 能 认为 硕 尔 排序 不 会 比 插入 排序 更 好 ， 因 为 它 最 后 一 步 执行 了 完整 的 插入 排 
序 。 然 而 ， 结 果 是 ， 该 最 终 插 入 排序 不 需要 进行 非常 多 的 比较 〈 或 移 位 ) ， 因 为 如 上 所 述 ， 
该 列表 已 经 被 较 早 的 增 量 插入 排序 预 排序 。 换 名 话说 ， 每 个 遍历 产生 比 前 一 个 “更 有 序 " 的 列 
表 。 这 使 得 最 终 遍 历 非常 有 效 。 


虽然 对 希 尔 排 序 的 一 般 分 析 远 远 超出 了 本 文 的 范围 ， 我 们 可 以 说 ， 它 倾向 于 落 在 O(n) 和 
O(n^2 ) 之 间 的 某 处 ， 基 于 以 上 所 描述 的 行为 。 对 于 Listing 5 中 显示 的 增 量 ， 性 能 为 O(n^2 ) 
。 通过 改变 增 量 ， 例 如 使 用 onk -1 (1,3,7,15,31 等 等 ) ° RPF TAE O (n^3/2 ) 处 执 


行 。 


5.11. 归 并 排序 


我 们 现在 将 注意 力 转 向 使 用 分 而 治之 策略 作为 提高 排序 算法 性 能 的 一 种 方法 。 我 们 将 研究 的 
第 一 个 算法 是 归并 排序 。 归 并 排序 是 一 种 递归 算法 ， 不 断 将 列表 拆 分 为 一 半 。 如 果 列 表 为 空 
或 有 一 个 项 ， 则 按 定 义 (基本 情况 ) 进行 排序 。 如 果 列 表 有 多 个 项 ， 我 们 分 割 列 表 ， 并 递归 
调用 两 个 半 部 分 的 合并 排序 。 一 旦 对 这 两 半 排 序 完 成 ， 就 执行 称 为 合并 的 基本 操作 。 合 并 是 
获取 两 个 较 小 的 排序 列表 并 将 它们 组 合成 单个 排序 的 新 列表 的 过 程 。Figure 10 展示 了 我 们 熟 
悉 的 示例 列表 ， 它 被 mergeSort JX) o Figure 11 展示 了 归并 后 的 简单 排序 列表 。 


"Baa 
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5.11.12 FBR 


Figure 10 
E a ag 
cm 
Da ajs 
doang and 
Skj 
ET 
Figure 11 


ActiveCode 1 中 展示 的 mergeSort 函数 从 询问 基本 情况 开始 。 如 果 列 表 的 长 度 小 于 或 等 于 
1， 则 我 们 已 经 有 有 序 的 列表 ， 并 且 不 需要 更 多 的 处 理 。 另 一 方面 ， 长 度 大 于 1， 那 么 我 们 使 
用 Python 切片 操作 来 提取 左右 两 半 。 重要 的 是 要 注意 ， 列 表 可 能 没有 偶数 个 项 。 这 并 不 重 


要 ， 因 为 长 度 最 多 相差 一 个 。 
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def mergeSort(alist): 
print("Splitting ",alist) 
if len(alist)>1: 
mid = len(alist)//2 
lefthalf = alist[:mid] 
righthalf = alist[mid: ] 


mergeSort(lefthalf ) 
mergeSort(righthalf ) 


i=0 
j=0 
k=0 
while i < len(lefthalf) and j < len(righthalf): 
if lefthalf[i] < righthalf[j]: 
alist [k]=lefthalf[i] 
i=i+1 
else: 
alist[k]=righthalf[j] 
j=j+1 
k=k+1 


while i < len(lefthalf): 
alist[k]=lefthalf[i] 
i=i+1 
k=k+1 


while j < len(righthalf): 
alist[k]=righthalf[j] 
JJA 
k=k+1 
print("Merging ",alist) 


alist = [54,26,93,17,77,31, 44,55, 20] 
mergeSort(alist) 
print(alist) 


Activecode1 


一 旦 在 左 半 部 分 和 右 半 部 分 (478-9) 上 调用 mergeSort 函数 ， 就 假定 它们 已 被 排序 。 函 数 的 
其 余部 分 (4711-31) 负责 将 两 个 较 小 的 排序 列表 合并 成 一 个 较 大 的 排序 列表 。 请 注意 ， 合 并 
操作 通过 重复 从 排序 列表 中 取 最 小 的 项 目 ， 将 项 目 逐 个 放 回 原始 列表 (alist) © 


mergeSort 函数 已 经 增加 了 一 个 打印 语句 (472) ， 以 显示 在 每 次 调用 开始 时 排序 的 列表 的 内 
容 。 还 有 一 个 打印 语句 (第 32 行 ) 来 显示 合并 过 程 。 示 了 在 我 们 的 示例 列表 中 执行 函 
数 的 结果 。 请 注意 ，44,55 和 2 的 列表 不 会 均匀 分 HAD 1 出 [44]， 第 二 个 
[55,20]。 很 容易 看 到 分 割 过 程 最 终 产 Se 


为 了 分 析 mergeSort 函数 ， 我 们 需要 考虑 组 成 其 实现 的 两 个 不 同 的 过 程 。 首 先 ， 列 表 被 分 成 
两 半 。 我 们 已 经 计算 过 (在 二 分 查找 中 ) 将 列表 划分 为 一 半 需 要 log^n 次 ， 其 中 CARN 
长 度 。 第 二 个 过 程 是 合并 。 列 表 中 的 每 个 项 将 最 终 被 处 理 并 放置 在 排序 的 列表 上 。 因 此 ， 大 
小 为 n 的 列表 的 合并 操作 需要 mn 个 操作 。 此 分 析 的 结果 是 log^n 的 拆 分 ， 其 中 每 个 操作 花费 
n， 总 共 nlog*n 。 归 并 排序 是 一 种 O(nlogn) 算法 。 


回想 切片 是 O(k)， 其 中 k 是 切片 的 大 小 。 为 了 保证 mergeSort 是 O(nlog^n )， 我 们 将 需要 删 
除 slice 运算 符 。 这 是 可 能 的 ， 如 果 当 我 们 进行 递归 调用 ， 我 们 简单 地 传递 开始 和 结束 索引 与 
列表 。 我 们 把 这 作为 一 个 练习 。 


重要 的 是 注意 ，mergeSort 函数 需要 额外 的 空间 来 保存 两 个 半 部 分 ， 因 为 它们 是 使 用 切片 操 
作 提 取 的 。 如 果 列 表 很 大 ， 这 个 额外 的 空间 可 能 是 一 个 关键 因素 ， 并 且 在 处 理 大 型 数据 集 时 
可 能 会 导致 此 类 问题 。 


5.12. 快 速 排序 


快速 排序 使 用 分 而 治之 来 获得 与 归并 排序 相同 的 优点 ， 而 不 使 用 额外 的 存储 。 然 而 ， 作 为 权 
衡 ， 有 可 能 列表 不 能 被 分 成 两 半 。 当 这 种 情况 发 生 时 ， 我 们 将 看 到 性 能 降低 。 


快速 排序 首先 选择 一 个 值 ， 该 值 称 为 mie 。 虽 然 有 很 多 不 同 的 方法 来 选择 枢 轴 值 ， 我 们 将 
使 用 列表 中 的 第 一 项 。 枢 轴 值 的 作用 是 帮助 拆 分 列表 。 枢 轴 值 属于 最 终 排序 列表 (通常 称 为 
拆 分 点 ) 的 实际 位 置 ， 将 用 于 将 列表 划分 为 快速 排序 的 后 续 调用 。 


Figure 12 展示 54 将 作为 我 们 的 第 一 个 枢纽 值 。 由 于 我 们 已 经 看 过 这 个 例子 几 次 ， 我 们 知道 
54 最 终 将 会 在 当前 持 有 31 的 位 置 。 接 下 来 将 发 生 分 区 过 程 。 它 将 找到 拆 分 点 ， 同 时 将 其 他 
项 移动 到 列表 的 适当 侧 ， 小 于 或 大 于 枢 轴 值 。 





54 will be the 
first pivot value 





Figure 12 
分 区 从 通过 在 列表 中 剩余 项 目的 开始 和 结束 处 定位 两 个 位 置 标记 (我 们 称 为 左 标 记 和 右 标 


记 ) 开始 (Figure 13 中 的 位 置 1 和 8 ) 。 分 区 的 目标 是 移动 相对 于 枢 轴 值 位 于 错误 侧 的 项 
同时 也 收敛 于 分 裂 点 。 Figure13 展 示 了 我 们 定位 54 的 位 置 的 过 程 。 


- 


5.12. 快 速 排序 


Figure 13 


我 们 首先 增加 左 标记 ， 





leftmark ————> mM rightmark 
26<54 move to right 
EGU 
leftmark rightmark 
now rightmark 
0go- +7 [77 | os [+ > kr 
leftmark rightmark 
= [oD [> [=] [oe [een ae 
leftmark rightmark 


now continue moving leftmark and rightmark 


77>54 stop 
44<54 stop 
exchange 77 and 44 





leftmark rightmark 


77>54 stop 
31<54 stop 
rightmark<leftmark 
split point found 
exchange 54 and 31 





rightmark — leftmark 
一 一 一 一 人 


+ 
until they cross 


这 发 生 在 93 和 20。 现 在 我 们 可 以 交换 这 两 个 项 目 ， 然 后 重复 该 过 程 。 


在 右 标 变 得 小 
7 内 容 交 换 ， 


用 快速 排序 。 


leftmark and rightmark 
will converge on split point 


直到 我 们 找到 一 个 大 于 枢 轴 值 的 值 。 然后 我 们 递减 右 标 ， 
到 小 于 枢 轴 值 的 值 。 我 们 发 现 了 两 个 相对 于 最 终 分 裂 点 位 置 不 适 


直到 我 们 找 


当 的 项 。 对 于 我 们 的 例子 ， 


于 左 标 记 的 点 ， 我 们 停止 。 右 标记 的 位 置 现 在 是 eas 
> 枢 轴 值 现在 就 位 (Figure 14) 。 此 外 ， 分 割 点 左 侧 的 所 有 项 都 小 于 枢 轴 值 ， 
Oe ie ee 
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54 is in place 





at bee) as |e | 


quicksort left half quicksort right half 


Figure14 


ActiveCode 1 中 显示 quicksort RAIA M 2% Ja R žk quickSortHelper ° quickSortHelper VA 
与 合并 排序 相同 的 基本 情况 开始 。 如 果 列 表 的 长 度 小 于 或 等 于 一 ， 它 已 经 排序 。 如 果 它 更 
大 ， 那 么 它 可 以 被 分 区 和 递归 排序 。 分 区 郊 数 实现 前 面 描述 的 过 程 。 
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def quickSort(alist): 
quickSortHelper(alist,0,len(alist)-1) 


def quickSortHelper(alist, first,last): 
if first<last: 


splitpoint = partition(alist, first, last) 


quickSortHelper(alist, first, splitpoint-1) 
quickSortHelper (alist, splitpoint+1, last) 


def partition(alist, first,last): 
pivotvalue = alist[first] 


leftmark = first+1 
rightmark = last 


done = False 
while not done: 


while leftmark <= rightmark and alist[leftmark] <= pivotvalue: 
leftmark = leftmark + 1 


while alist[rightmark] >= pivotvalue and rightmark >= leftmark: 


rightmark = rightmark -1 


if rightmark < leftmark: 
done = True 

else: 
temp = alist[leftmark] 
alist[leftmark] = alist[rightmark] 
alist[rightmark] = temp 


temp = alist[first] 
alist[first] = alist[rightmark] 
alist[rightmark] = temp 


return rightmark 


alist = [54,26,93,17,77,31,44,55, 20] 
quickSort(alist) 
print(alist) 


要 分 析 quickSort 函数 ， 请 注意 ， 对 于 长 度 为 n 的 列表 ， 如 果 分 区 总 是 出 现在 列表 中 间 ， 则 
会 再 次 出 现 logn 分 区 。 为 了 找到 分 割 点 ， 需 要 针对 枢 轴 值 检查 n 个 项 中 的 每 一 个 。 结 果 是 
nlogn。 此 外 ， 在 归并 排序 过 程 中 不 需要 额外 的 存储 器 。 


不 幸 的 是 ， 在 最 坏 的 情况 下 ， 分 裂 点 可 能 不 在 中 间 ， 并 且 可 能 非常 偏向 左边 或 右边 ， 留 下 非 
常 不 均匀 的 分 割 。 在 这 种 情况 下 ， 对 n 个 项 的 列表 进行 排序 划分 为 对 0 个 项 的 列表 和 n-1 个 
项 目的 列表 进行 排序 。 然 后 将 n-1 个 划分 的 列表 排序 为 大 小 为 0 的 列表 和 大 小 为 n-2 的 列表 ， 
以 此 类 推 。 结 果 是 具有 递归 所 需 的 所 有 开销 的 O(n) 排序 。 


我 们 之 前 提 到 过 ， 有 不 同 的 方法 来 选择 枢纽 值 。 特 别 地 ， 我 们 可 以 尝试 通过 使 用 称 为 中 值 三 
的 技术 来 减轻 一 些 不 均匀 分 割 的 可 能 性 。 要 选择 枢 轴 值 ， 我 们 将 考虑 列表 中 的 第 一 个 ， 中 间 
。 在 我 们 的 示例 中 ， 这 些 是 54,77 和 20. 现 在 选择 中 值 ， 在 我 们 的 示例 中 为 
tt a ot a a 
aie 的 情况 下 ， 中 值 三 将 选择 更 好 的 “中 间 ” 值 。 当 原始 列表 部 分 有 序 时 ， 这 将 特 
别 有 用 。 我 们 将 此 枢 轴 值 选择 的 实现 作为 练习 。 


5.13. 总 结 


e 对 于 有 序 和 无 序列 表 ， 顺 序 搜索 是 O(n)。 

。 在 最 坏 的 情况 下 ， 有 序列 表 的 二 分 查找 是 D(logn ) 。 

e 哈 希 表 可 以 提供 恒定 时 间 搜 索 。 

冒 泡 排 序 ， 选 择 排序 和 插入 排序 是 O(n^2 ) 算 法 。 

e shell 排 序 通过 排序 增 量子 列表 来 改进 插入 排序 。 它 落 在 O(n) 和 O(n^2 ) 之 间 。 

归并 排序 是 O(nlog^n ) ， 但 是 合并 过 程 需要 额外 的 空间 。 

快速 排序 是 O(nlog^n ) ， 但 如 果 分 割 点 不 在 列表 中 间 附 近 ， 可 能 会 降级 到 O(n^2 ) 。 它 
不 需要 额外 的 空间 。 


6. 树 和 树 的 工法 
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6.1. 目 标 


o 要 理解 树 数据 结构 是 什么 ， 以 及 如 何 使 用 它 。 
© 查看 树 如 何 用 于 实现 map 数据 结构 。 

e 使 用 列表 实现 树 。 

© 使 用 类 和 引用 来 实现 树 。 

© 实现 树 作 为 递归 数据 结构 。 

e 使 用 堆 实现 优先 级 队列 。 


6.2. 树 的 例子 


现在 我 们 已 经 研究 了 线性 数据 
为 树 的 常见 数据 结构 。 树 在 计 草 机 科学 的 许多 令 
结构 与 他 们 的 植物 表亲 有 许多 共 
和 叶 。 自 然 界 中 的 树 和 计算 机 科学 中 的 树 之 间 的 区 别 在 于 树 数 据 结构 的 根 在 顶部 ， 


统 和 计算 机 网 络 。 树 数据 


部 。 


在 我 们 开始 研究 树 形 数据 结 
物 学 的 分 类 树 。Figure 1 展示 了 一 些 动物 的 生物 分 类 的 实例 。 
了 解 树 的 几 个 属性 。 此 示例 演示 的 第 一 个 属性 是 树 是 
层次 结构 ， 更 接近 顶部 的 是 抽象 的 东西 和 底部 附近 是 更 具体 的 东西 。 层 ; 
Kingdom ， 树 的 下 一 层 (上 面 的 层 的 “Children”) 是 
无 论 我 们 在 分 类 树 中 有 多 深 ， 所 有 的 生物 仍然 是 


Kingdom 


Phylum 








Figure 1 


注意 ， 你 可 以 从 树 的 顶部 开始 ， 并 沿 着 圆圈 和 箭头 

能 问 自己 一 个 问题 ， 然 后 遵循 与 我 们 的 答案 一 致 的 路 径 
还 是 Arthropod( 节 肢 动物 )? 
这 个 Chordate 是 Mammal( 哺 乳 动物 ) 吗 2 "如果 不 是 ， 我 们 就 卡 住 了 这 


ea 物 ) 还 
条 路 径 ， 问 “> 


告 构 ， 如 栈 和 队列 ， 并 且 有 一 些 递归 的 经 验 ， 我 们 将 看 一 个 称 
页 域 中 使 用 ， 包 括 操作 系统 ， 图 形 ， 数 据 库 系 
共同 之 处 。 树 数据 结构 具有 根 ， 分 支 


其 叶 在 底 


吉 构 之 前 ， 让 我 们 来 看 几 个 常见 的 例 o ss 的 第 一 个 例子 是 生 
简单 的 例子 ， 我 们 可 以 
分 层 的 。 通 过 cacy 我 们 的 意思 是 树 的 
次 结构 的 顶部 是 


Phylum ， 然 后 是 Class ， 等 等 。 然 而 ， 
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o 例如， 我 们 可 能 会 问 ，“ 这 个 动物 
"ho RA R 5é“Chordate” > AA a 
文 个 简化 的 例 


F) 。 当 我 们 在 哺乳 动物 那 层 时 ， 我 们 问 “ 这 个 哺乳 动物 是 Primate( 灵 长 类 动物 ) 还 是 
Carnivore( 食 肉 动物 )? ”我 们 可 以 遵循 以 下 路 径 ， 直 到 我 们 到 达 树 的 最 底部 ， 在 那里 我 们 有 共 
同 的 名 字 。 


树 的 第 二 个 属性 是 一 个 节点 的 所 有 子 节点 独立 于 另 一 个 节点 的 子 节点 。 例 如 ，Felis 有 属于 
Domestica 和 Leo 的 孩子 。Musca 也 有 一 个 名 为 Domestica 的 孩子 ， 但 它 是 一 个 不 同 uA 
点 ， 并 独立 于 Felis 的 Domestica 和 孩子 。 这 意味 着 我 们 可 以 改变 作为 Musca 的 孩子 的 节 

不 影响 Felis 的 孩子 。 


第 三 个 属性 是 每 个 叶 节 点 是 唯一 的 。 我 们 可 以 指定 从 树 的 根 到 唯一 地 识别 动物 王国 中 的 每 个 
物种 的 叶 的 路 径 ; 例 如 ， 
Animalia 一 一 Chordate 一 一 Mammal 一 一 Carnivora 一 一 Felidae 一 一 Felis 一 一 Domestica。 


你 可 能 每 天 使 用 的 树 结构 的 另 一 个 示例 是 文件 系统 。 在 文件 系统 中 ， 目 录 或 文件 夹 被 构造 为 
树 。Figure 2 说 明了 Unix 文 件 系统 层次 结构 的 一 小 部 分 。 


Figure2 


文件 系统 树 与 生物 分 类 权 有 很 多 共同 之 处 。 你 可 以 遵循 从 根 目 录 到 任何 目录 的 路 径 。 该 路 径 
将 唯一 标识 该 子 目录 〈 及 其 中 的 所 有 文件 ) 。 树 的 另 一 个 重要 属性 来 源 于 它们 的 层次 性 质 ， 
你 可 以 将 树 的 整个 部 分 ( 称 为 子 树 ) 移动 到 树 中 的 不 同位 置 ， 而 不 影响 层次 结构 的 较 低 级 
别 。 例 如， 我 们 可 以 使 用 整个 子 树 /etc/， 从 根 节 点 分 离 ， 并 重新 附加 在 Usr/ 下 。 这 将 把 
httpd 的 唯一 路 径 名 从 /etc/httpd 更 改 为 /usr/etc/httpd， 但 不 会 影响 httpd 目录 的 内 容 或 任何 
FR 


树 的 最 后 一 个 例子 是 网 页 。 以 下 是 使 用 HTML 编 写 的 简单 网 页 的 示例 。 Figure 3 展示 了 用 于 
创建 页 面 的 每 个 HTML 标记 的 树 。 


<html xmlns="http://www.w3.org/1999/xhtm1" 
xml: lang="en" lang="en"> 
<head> 
<meta http-equiv="Content-Type" 
content="text/html; charset=utf-8" /> 
<title>simple</title> 
</head> 
<body> 
<hi>A simple web page</h1> 
<ul> 
<li>List item one</li> 
<li>List item two</li> 
</ul> 
<h2><a href="http://ww.cs.luther.edu">Luther CS </a><h2> 
</body> 
</html> 


Figure 3 


HTML 源 代码 和 伴随 源 的 树 说 明了 另 一 个 层次 结构 。 请 注意 ， 树 的 每 个 级 别 都 对 应 于 HTML 标 
记 内 的 获 套 级 别 。 源 中 的 第 一 个 标记 是 ， 最 后 一 个 是 </ html> 页 面 中 的 所 有 其 余 标记 都 是 成 
对 的 。 如 果 你 检查 ， 你 会 看 到 这 个 寿 套 属性 在 树 的 所 有 级 别 都 是 true。 


6.3.74 C Fe SL 
我 们 已 经 看 了 树 的 示例 ， 我 们 将 正式 定义 树 及 其 组 件 。 
节点 


节点 是 树 的 基本 部 分 。 它 可 以 有 一 个 名 称 ， 我 们 称 之 为 " 键 "。 节 点 也 可 以 有 附加 信息 。 我 们 将 
这 个 附加 信息 称 为 “有 效 载荷 *%。 虽 然 有 效 载荷 信息 不 是 许多 树 算法 的 核心 ， 但 在 利用 树 的 应 用 
中 通常 是 关键 的 。 

边 

边 是 树 的 另 一 个 基本 部 分 。 边 连接 两 个 节点 以 显示 它们 之 间 存 在 关系 。 每 个 节点 (除根 之 
外 ) 都 恰好 从 另 一 个 节点 的 传 入 连接 。 每 个 节点 可 以 具有 多 个 输出 边 。 

根 

树 的 根 是 树 中 唯一 没有 传 入 边 的 节点 。 在 Figure 2 中 ，/ 是 树 的 根 。 

路 径 


路 径 是 由 边 连 接 节点 的 有 序列 表 。 例 如 ， 
Mammal 一 一 Carnivora 一 一 Felidae 一 一 Felis 一 一 Domestica 是 一 条 路 径 。 


子 节 点 


具有 来 自 相同 传 入 边 的 节点 C 的 集合 称 为 该 节点 的 子 节点 。 在 Figure 2 中 ， 节 点 log/，spool/ 
和 yp/ 是 节点 Var 的 子 节点 。 


父 节点 


具有 和 它 相 同 传 入 边 的 所 连接 的 节点 称 为 父 节 点 。 在 Figure 2 中 ， 节 点 Var 是 节点 log/， 
spool/ 和 yp/ 的 父 节 点 。 


兄弟 


树 中 作为 同一 父 节 点 的 子 节点 的 节点 被 称 为 兄弟 节点 。 节 点 etc/ 和 Usr/ 是 文件 系统 树 中 的 兄 
弟 节点 。 


Fa 


子 树 是 由 父 节 点 和 该 父 节 点 的 所 有 后 代 组 成 的 一 组 节点 和 边 。 


叶 节 点 是 没有 子 节点 的 节点 。 例如 ， 人 类 和 黑猩猩 是 Figure 1 中 的 叶 节 点 。 


数 


Ju 


点 Nn 的 层 数 为 从 根 结 点 到 该 结 点 所 经 过 的 分 支 数 目 。 例如， 图 1 中 的 Felis 节 点 的 级 别 为 


TA 


节 ， 
五 。 根 据 定 义 ， 根 节点 的 层 数 为 零 。 


度 


I 


树 的 高 度 等 于 树 中 任何 节点 的 最 大 层 数 。 Figure 2 中 的 树 的 高 度 是 2。 


现在 已 经 定义 了 基本 词汇 ， 我 们 可 以 继续 对 树 的 正式 定义 。 事实 上 ， 我 们 将 提供 一 个 树 的 两 
个 定义 。 一 个 定义 涉及 节点 和 边 。 第 二 个 定义 ， 将 被 证 明 是 非常 有 用 的 ， 是 一 个 递归 定义 。 
定义 一 : 树 由 一 组 节点 和 一 组 连接 节点 的 边 组 成 。 树 具有 以 下 属性 : 

o 树 的 一 个 节点 被 指定 为 根 节点 。 

。 除了 根 节点 之 外 ， 每 个 节点 n 通过 一 个 其 他 节点 p 的 边 连 接 ， 其 中 pp 是 n 的 父 节点 。 
© 从 根 路 径 遍 历 到 每 个 节点 路 径 唯 一 。 

e 如 果树 中 的 每 个 节点 最 多 有 两 个 子 节点 ， 我 们 说 该 树 是 一 个 二 又 树 。 


Figure 3 展示 了 适合 定义 一 的 树 。 边 上 的 箭头 指示 连接 的 方向 。 





rootnode 













Figure 3 

定义 二 : 树 是 空 的 ， 或 者 由 一 个 根 节 点 和 零 个 或 多 个 子 树 组 成 ， 每 个 子 树 也 是 一 棵 树 。 每 个 
子 树 的 根 节点 通过 边 连接 到 父 树 的 根 节点 。 Figure 4 说 明了 树 的 这 种 递归 定义 。 使 用 树 的 递 
归 定 义 ， 我 们 知道 Figure 4 中 的 树 至 少 有 四 个 节点 ， 因 为 表示 一 个 子 树 的 每 个 三 角形 必须 有 
一 个 根 节点 。 它 可 能 有 比 这 更 多 的 节点 ， 但 我 们 不 知道 ， 除 非 我 们 更 深入 树 。 


6.3. 词 汇 和 定义 


Figure 4 
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6.4. 列 表 表 示 


在 由 列表 表示 的 树 中 ， 我 们 将 从 Python 的 列表 数据 结构 开始 ， 并 编写 上 面 定 义 的 函数 。 虽 然 
将 接口 作为 一 组 操作 在 列表 上 编写 与 我 们 实现 的 其 他 抽象 数据 类 型 有 点 不 同 ， 但 这 样 做 是 有 
趣 的 ， 因 为 它 为 我 们 提供 了 一 个 简单 的 递归 数据 结构 ， 我 们 可 以 直接 查看 和 检查 。 在 列表 树 
的 列表 中 ， 我 们 将 根 节点 的 值 存 储 为 列表 的 第 一 个 元 素 。 列 表 的 第 二 个 元 素 本 身 将 是 一 个 表 
示 左 子 树 的 列表 。 列 表 的 第 三 个 元 素 将 是 表示 右 子 树 的 另 一 个 列表 。 为 了 说 明 这 种 存储 技 
术 ， 让 我 们 看 一 个 例子 。 Figure 1 展示 了 一 个 简单 的 树 和 相应 的 列表 实现 。 


Figure 1 


myTree = ['a',  #root 
['b', #left subtree 
['d', [], [J], 
['e', [], []] ]， 
['c', #right subtree 
['f', [1], C11, 
[1] ] 
] 


注意 ， 我 们 可 以 使 用 标准 列表 索引 来 访问 列表 的 子 树 。 树 的 根 是 myTree[6] ， 根 的 左 子 树 是 
myTree[1] ， 右 子 树 是 myTree[2] ° ActiveCode 1 说 明了 使 用 列表 创建 一 个 简单 的 树 。 一 旦 
树 被 构建 ， 我 们 可 以 访问 根 和 左右 子 树 。 该 列表 方法 的 一 个 非常 好 的 属性 是 表示 子 树 的 列表 
的 结构 遵守 树 定义 的 结构 ; 结构 本 身 是 递归 的 | 具有 根 值 和 两 个 空 列表 的 子 树 是 叶 节 点 。 列 表 
方法 的 另 一 个 很 好 的 特性 是 它 可 以 推广 到 一 个 有 许多 子 树 的 树 。 在 树 超过 二 又 树 的 情况 下 ， 
另 一 个 子 树 只 是 另 一 个 列表 。 


myTree = ['a', ['b', [dy ev 1; ['c', ['f',[],[]], []] ] 
print(myTree) 

print('left subtree = ', myTree[1]) 

print('root = ', myTree[0]) 

print('right subtree = ', myTree[2]) 


Activecode 1 


让 我 们 提供 一 些 使 我 们 能 够 使 用 列表 作为 树 的 函数 来 形式 化 树 数据 结构 的 这 个 定义 。 注 意 ， 
我 们 不 会 定义 一 个 二 又 树 类 。 我 们 写 的 函数 只 是 帮助 我 们 操纵 一 个 标准 列表 ， 就 像 我 们 正在 
使 用 一 棵 树 。 


def BinaryTree(r): 
return [r, [], []] 


BinaryTree 函数 简单 地 构造 一 个 具有 根 节点 和 两 个 子 列表 为 空 的 列表 。 要 将 堪 子 树 添加 到 树 
的 根 ， 我 们 需要 在 根 列 表 的 第 二 个 位 置 播 入 一 个 新 的 列表 。 我 们 必须 小 心 。 如 果 列 表 已 经 在 
第 二 个 位 置 有 东西 ， 我 们 需要 跟踪 它 ， 并 沿 着 树 向 下 把 它 作为 我 们 添加 的 列表 的 左 子 节点 。 
Listing 1 展示 了 插入 左 子 节点 的 Python 代码 。 


def insertLeft(root,newBranch): 
t = root.pop(1) 
if len(t) > 1: 
root.insert(1, [newBranch,t,[]]) 
else: 
root.insert(1,[newBranch, [], []]) 
return root 


Listing 1 


注意 ， 要 插入 一 个 左 子 节点 ， 我 们 首先 获得 与 当前 左 子 节点 对 应 的 (可 能 为 空 的 ) 列表 。 然 
后 我 们 添加 新 的 左 子 树 ， 添 加 旧 的 左 子 数 作为 新 子 节 点 的 左 子 节点 。 这 人 允许 我 们 在 任何 位 置 
将 新 节点 拼接 到 树 中 。 insertRight 的 代码 与 insertLeft 类 似 ， 如 Listing 2 所 示 。 


def insertRight(root,newBranch): 
t = root.pop(2) 
if len(t) > 1: 
root.insert(2, [newBranch, [],t]) 
else: 
root.insert(2, [newBranch, [],[]]) 
return root 


Listing 2 


AT RRA BR (IK Listing 3) ， 让 我 们 编写 一 些 访问 函数 来 获取 和 设置 根 节 点 的 
值 ， 以 及 获取 左 或 右 子 树 。 


def getRootVal(root): 
return root[9] 


def setRootVal(root,newVal): 
root[0] = newVal 


def getLeftChild(root): 
return root[1] 


def getRightChild(root): 
return root[2] 


Listing 3 


节点 表示 


我 们 a ey 点 和 引用 。 在 这 种 情况 下 ， on 
的 类 ， 以 及 左 和 右 子 树 。 这 个 表示 更 接近 于 面向 对 象 的 编程 范例 ， 我 们 将 继续 使 用 这 
Row 


使 用 节点 和 引用 ， 我 们 认为 树 结构 类 似 于 Figure 2 所 示 。 


| 


| 

















Figure 2 


我 们 将 从 节点 和 引用 方法 的 一 个 简单 的 类 定义 开始 ， 如 Listing 4 所 示 。 要 记 住 这 个 表示 重要 
的 事情 青 是 left 和 right 的 属 ， 性 将 成 为 对 BinaryTree 类 的 其 他 实例 的 引用 o 例如， 当 我 
们 在 树 中 插入 一 个 新 的 左 子 节点 时 ， 我 们 创建 另 一 个 BinaryTree 实例 ， 并 在 根 节点 中 修 
PX self.leftchild 来 引用 新 树 节点 。 


class BinaryTree: 
def __init__(self, rootObj): 
self.key = rootObj 
self.leftChild = None 
self.rightChild = None 


Listing 4 


请 注意 ， 在 Listing 4 中 ， 构 造 函 数 希 望 获取 某 种 对 象 存储 在 根 中 。 就 像 你 可 以 在 列表 中 存储 
任何 你 喜欢 的 对 象 一 样 ， 树 的 根 对 象 可 以 是 对 任何 对 象 的 引用 。 对 于 我 们 的 先前 示例 ， 我 们 
将 存储 节点 的 名 称 作 为 根 值 。 使 用 节点 和 引用 来 表示 Figure 2 中 的 树 ， 我 们 将 创建 


BinaryTree 类 的 六 个 实例 。 


接 下 来 ， 我 们 来 看 看 需要 构建 超出 根 节 点 的 树 的 函数 。 要 向 树 中 添加 一 个 左 子 树 ， 我 们 将 创 
建 一 个 新 的 二 又 树 对 象 ， 并 设置 根 的 左边 属性 来 引用 这 个 新 对 象 。 insertLeft 的 代码 如 
Listing 5 所 示 。 


def insertLeft(self,newNode): 
if self.leftChild == None: 
self.leftChild = BinaryTree(newNode) 
else: 
t = BinaryTree(newNode) 
t.leftChild = self.leftChild 
self.leftChild = t 


Listing 5 


我 们 必须 考虑 两 种 插入 情况 。 第 一 种 情况 的 特征 没有 现 有 左 孩 子 的 节点 。 当 没有 左 孩 子 时 ， 
只 需 向 树 中 添加 一 个 节点 。 第 二 种 情况 的 特征 在 于 具有 现 有 左 孩 子 的 节点 。 在 第 二 种 情况 
下 ， 我 们 插入 一 个 节点 并 将 现 有 的 子 节 点 放 到 树 中 的 下 一 个 层 。 第 二 种 情况 由 Listing5 第 4 
行 的 else 语句 处 理 。 


insertRight 的 代码 必须 考虑 一 组 对 称 的 情况 。 没 有 右 孩 子 ， 或 者 我 们 在 根 和 现 有 右 孩 子 之 
间 插 入 节点 。 插 入 代码 如 Listing 6 所 示 。 


def insertRight(self,newNode): 
if self.rightChild == None: 
self.rightChild = BinaryTree(newNode) 
else: 
t = BinaryTree(newNode) 
t.rightChild = self.rightChild 
self.rightChild = t 


Listing 6 
为 了 完成 一 个 简单 二 又 树 数 据 结构 的 定义 ， 我 们 将 实现 获取 左 和 右 孩 子 ( 见 Listing 7 ) 以 及 


根 值 的 方法 。 


def getRightChild(self): 
return self.rightChild 


def getLeftChild(self): 
return self.leftChild 


def setRootVal(self,obj): 
self.key = obj 


def getRootVal(self): 
return self.key 


Listing 7 


现在 我 们 有 了 创建 和 操作 二 又 树 的 所 有 部 分 ， 让 我 们 使 用 它们 来 检查 结构 。 我 们 使 用 节点 a 
作为 根 的 简单 树 ， 并 将 节点 b 和 c 添加 为 子 节点 。ActiveCode 1 创建 树 并 查看 存储 在 key >’ 
left 和 right 中 的 一 些 值 。 注 意 ， 根 的 左 和 右 孩 子 本 身 是 BinaryTree 类 的 不 同 实例 。 正 如 我 们 
在 对 树 的 原始 递归 定义 中 所 说 的 ， 这 允许 我 们 将 二 又 树 的 任何 子 项 视 为 二 又 树 本 身 。 


class BinaryTree: 
def _ init__(self, rootObj): 
self.key = rootObj 
self.leftChild = None 
self.rightChild = None 


def insertLeft(self,newNode): 
if self.leftChild == None: 
self.leftChild = BinaryTree(newNode) 
else: 
t = BinaryTree(newNode) 
t.leftChild = self.leftChild 
self.leftChild = t 


def insertRight(self,newNode): 
if self.rightChild == None: 
self.rightChild = BinaryTree(newNode) 
else: 
t = BinaryTree(newNode) 
t.rightChild = self.rightChild 
self.rightChild = t 


def getRightChild(self): 
return self.rightChild 


def getLeftChild(self): 
return self.leftChild 


def setRootVal(self,obj): 
self.key = obj 


def getRootVal(self): 
return self.key 


r = BinaryTree('a') 
print(r.getRootVal() ) 
print(r.getLeftChild()) 
r.insertLeft('b') 
print(r.getLeftChild()) 
print(r.getLeftChild().getRootVal()) 
r.insertRight('c') 
print(r.getRightChild()) 
print(r.getRightChild().getRootVal()) 
r.getRightChild().setRootVal('hello' ) 
print(r.getRightChild().getRootVal()) 
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6.6.7 77 4 


随 着 我 们 的 树 数据 结构 的 实现 完成 ， 我 们 现在 看 一 个 例子 ， 说 明 如 何 使 用 树 来 解决 一 些 
的 问题 。 在 本 节 中 ， 我 们 将 讨论 分 析 树 。 分 析 树 可 以 用 于 表示 诸如 句子 或 数学 表达 式 的 


世界 构造 。 
Verb Phrase 


Poor os) Vet) Com rane 
HD Greer ou) 


Figure 1 展示 了 一 个 简单 句子 的 层次 结构 。 将 句子 表示 为 树 结 构 允许 我 们 通过 使 用 子 树 来 处 
理 包子 的 各 个 部 分 
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Figure 1 


我 们 还 可 以 表示 诸如 ((7+3)*(5-2) ) 数学 表达 式 作为 分 析 树 ， 如 Figure 2 所 示 。 我 们 
早 看 过 完全 括号 表达 式 ， 所 以 我 们 知道 这 个 表达 式 是 什么 ?我们 知道 乘法 具有 比 加 法 或 减法 
更 高 的 优先 级 。 由 于 括号 ， 我 们 知道 在 做 乘法 之 前 ， 我 们 必须 计算 括号 里 面 的 加 法 和 减法 表 
达 式 。 树 的 层次 结构 有 助 于 我 们 了 解 整个 表达 式 的 求 值 顺序 。 在 我 们 计算 顶层 乘法 之 前 ， 我 
们 必须 计算 子 树 中 的 加 法 和 减法 。 作 为 左 子 树 的 加 法 结果 为 10。 减 法， 即 右 子 树 ， 计 算 结 果 
为 3。 使 用 树 的 层次 结构 ， 我 们 可 以 简单 地 用 一 个 节点 替换 整个 子 树 ， 一 旦 我 们 计算 了 表达 式 
中 这 些 子 树 。 这 个 替换 过 程 给 出 了 Figure 3 所 示 的 简化 树 。 


在 本 节 的 其 余部 分 ， 我 们 将 更 详细 地 检查 分 析 树 。 特别 的 ， 我 们 会 看 


Figure 2 


Figure 3 


© 如 何 从 完全 括号 的 数学 表达 式 构建 分 析 树 。 

© 如 何 评估 存储 在 分 析 树 中 的 表达 式 。 

© 如 何 从 分 析 树 中 恢复 原始 数学 表达 式 。 
构建 分 析 树 的 第 一 步 是 将 表达 式 字 符 串 拆 分 成 符号 列表 。 有 四 种 不 同 的 符号 要 考虑 : 左 括 
号 ， 右 括号 ， 运 算 符 和 操作 数 。 我 们 知道 ， 每 当 我 们 读 一 个 左 括 号 ， 我 们 开始 一 个 新 的 表达 
式 ， 因 此 我 们 应 该 创建 一 个 新 的 树 来 对 应 于 该 表达 式 。 相反， 每 当 我 们 读 一 个 右 括号 ， 我 们 


就 完成 了 一 个 表达 式 。 我 们 还 知道 操作 数 将 是 叶 节点 和 它们 的 操作 符 的 子 节点 。 最 后 ， 我 们 
知道 每 个 操作 符 都 将 有 一 个 左 和 右 孩 子 。 


使 用 上 面 的 信息 ， 我 们 可 以 定义 四 个 规则 如 下 : 


。 如 果 当 前 符号 是 '(' ， 添 加 一 个 新 节点 作为 当前 节点 的 左 子 节点 ， 并 下 降 到 左 子 节点 。 

e 如 果 当 前 符号 在 列表 pert -'，'/'，'*'] 中 ， 请 将 当前 节点 的 根 值 设置 为 由 当前 符号 
表示 的 运算 符 。 添 加 一 个 新 节点 作为 当前 节点 的 右 子 节点 ， 并 下 降 到 右 子 节点 。 

© 如 果 当 前 符号 是 数字 ， 请 将 当前 节点 的 根 值 设置 为 该 数字 并 返回 到 父 节点 。 

e 如 果 当 前 令 牌 是 O ， 则 转 到 当前 节点 的 父 节点 。 


在 编写 Python 代码 之 前 ， 让 我 们 看 看 上 面 列 出 的 规则 的 一 个 例子 。 我 们 将 使 用 表达 

A (3+ (4* 5) ) 。 我们 将 把 这 个 表达 式 解析 成 下 面 的 字符 标记 列表 
[51 tyt a ty) 。 最 初 ， 我 们 将 使 用 由 空 根 节点 组 成 的 分 析 树 

开始 。 Figure 4 展示 了 当 每 个 新 符号 被 处 理 时 分 析 树 的 结构 和 内 容 。 
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Figure 4 
使 用 Figure 4， 让 我 们 一 步 一 步 地 浏览 示例 : 
a. 创建 一 个 空 树 。 


b. 读 取 ( 作为 第 一 个 标记 。 按 规则 1， 创 建 一 个 新 节点 作为 根 的 左 子 节点 。 使 当前 节点 到 这 个 
MFT 
CER 3 作为 下 一 个 符号 。 按 照 规则 3， 将 当前 节点 的 根 值 设置 为 3， 使 当前 节点 返回 到 父 节 


点 o 
Assy 


d. 读 取 + 作为 下 一 个 符号 。 根 据 规则 2， 将 当前 节点 的 根 值 设置 为 +， 并 添加 一 个 新 节点 作为 
右 子 节点 。 新 的 右 子 节点 成 为 当前 节点 。 


e. 读 取 ( 作为 下 一 个 符号 ， 按 规则 1， 创 建 一 个 新 节点 作为 当前 节点 的 左 子 节点 ， 新 的 左 子 节 
点 成 为 当前 节点 。 


f. 读 取 4 作为 下 一 个 符号 。 根 据 规 则 3， 将 当前 节点 的 值 设 置 为 4。 使 当前 节点 返回 到 父 节 
点 。 


g. 读 取 作为 下 一 个 符号 。 根 据 规 则 2， 将 当前 节点 的 根 值 设置 为 ， 并 创建 一 个 新 的 右 子 节 
点 。 新 的 右 子 节点 成 为 当前 节点 


h. 读 取 5 作为 下 一 个 符号 。 根 据 规 则 3， 将 当前 节点 的 根 值 设置 为 5。 使 当前 节点 返回 到 父 
A? 


i. 读 取 ) 作为 下 一 个 符号 。 根 据 规则 4， 使 当前 节点 返回 到 父 节 点 。 


j. 读 取 ) 作为 下 一 个 符号 。 根 据 规则 4， 使 当前 节点 返回 到 父 节点 +。 没有 + 的 父 节点 ， 所 以 
我 们 完成 创建 。 


从 上 面 的 例子 ， 很 明显 ， 我 们 需要 跟踪 当前 节点 以 及 当前 节点 的 父 节 点 。 树 接口 为 我 们 提供 
了 一 种 通过 getLeftchild 和 getRightchild 方法 获取 节点 的 子 节点 的 方法 ， 但 是 我 们 如 何 
跟踪 父 节点 呢 ? 当 我 们 遍历 树 时 ， 保 持 跟踪 父 对 象 的 简单 解决 方案 是 使 用 栈 。 每 当 我 们 想 下 
降 到 当前 节点 的 子 节点 时 ， 我 们 首先 将 当前 节点 入 到 栈 上 。 当 我 们 想 要 返回 到 当前 节点 的 父 
节点 时 ， 我 们 将 父 节 点 从 栈 中 弹出 。 


使 用 上 述 规则 ， 以 及 stack 和 BinaryTree 操作 ， 我 们 现在 可 以 编写 一 个 Python 函数 来 创建 
一 个 分 析 树 。 我 们 的 分 析 树 生成 器 的 代码 见 ActiveCode 1 ° 


from pythonds.basic.stack import Stack 
from pythonds.trees.binaryTree import BinaryTree 


def buildParseTree(fpexp): 
fplist = fpexp.split() 
pStack = Stack() 
eTree = BinaryTree('') 
pStack.push(eTree) 
currentTree = eTree 
for i in fplist: 
if i == '(': 
currentTree.insertLeft('') 
pStack.push(currentTree) 
currentTree = currentTree.getLeftChild() 
GHEE n ot m/l 
currentTree.setRootVal(int(i)) 
parent = pStack.pop() 
currentTree = parent 
Cube sh ali [vere Mote Pe ee 
currentTree.setRootVal(i) 
currentTree.insertRight('') 
pStack.push(currentTree) 
currentTree = currentTree.getRightChild() 
elif i == ')': 
currentTree = pStack.pop() 
else: 
raise ValueError 
return eTree 


pt = buildParseTree("( ( 10 +5 ) * 3 )") 
pt.postorder() #defined and explained in the next section 


Activecode1 


用 于 构建 分 析 树 的 四 个 规则 被 编码 为 ActiveCode 1 的 行 11,15,19 和 24 上 的 并 语句 的 前 四 个 
子 甸 。 在 每 种 情况 下 ， 可 以 看 到 代码 实现 了 如 上 所 述 的 规则 ， 与 几 个 调用 BinaryTree 或 
Stack 方法 。 我 们 在 这 个 函数 中 唯一 的 错误 检查 是 在 else 子 名 中， 如 果 我 们 从 列表 中 得 到 一 
个 我 们 不 认识 的 token > #414] 2—7ValueError+#  ° 


现在 我 们 已 经 构建 了 一 个 分 析 树 ， 我 们 可 以 用 它 做 什么 ? 作为 第 一 个 例子 ， 我 们 将 编写 一 个 
哆 数 来 评估 分 析 树 ， 返 回 数值 结果 。 要 写 这 个 防 数 ， 我 们 将 利用 树 的 层次 性 。 回 想 一 下 
Figure 2。 我 们 可 以 用 Figure 3 中 所 示 的 简化 树 蔡 换 原 始 树 。 这 表明 我 们 可 以 编写 一 个 算法 ， 
通过 递归 地 评估 每 个 子 树 来 评估 一 个 分 析 树 。 


正如 我 们 对 过 去 的 递归 算法 所 做 的 ， 我 们 将 通过 识别 基本 情况 来 开始 递归 评价 函数 的 设计 。 
对 树 进 行 操作 的 递归 算法 的 基本 情况 是 检查 叶 节 点 。 在 分 析 树 中 ， 叶 节点 将 始终 是 操作 数 。 
由 于 整数 和 浮 点 等 数值 对 象 不 需要 进一步 解释 ， 因 此 evaluate 函数 可 以 简单 地 返回 存储 在 
叶 节 点 中 的 值 。 将 函数 移 向 基本 情况 的 递归 步骤 是 在 当前 节点 的 左 子 节点 和 右 子 节点 上 调用 
evaluate。 递 归 调 用 有 效 地 使 我 们 沿 着 树 向 着 叶 节 点 移动 。 


为 了 将 两 个 递归 调用 的 结果 放 在 一 起 ， 我 们 可 以 简单 地 将 存储 在 父 节点 中 的 运算 符 应 用 于 从 
评估 这 两 个 子 节点 返回 的 结果 。 在 Figure 3 的 示例 中 ， 我 们 看 到 根 的 两 个 孩子 计算 得 出 结 
果 ， 即 10 和 3。 应 用 乘法 运算 符 给 我 们 一 个 最 终结 果 30° 


递归 求 值 函 数 的 代码 如 Listing 1 所 示 。 首 先 ， 我 们 获取 对 当前 节点 的 左 子 节点 和 右 子 节点 的 
引用 。 如 果 左 和 右 孩 子 都 为 None ， 那 么 我 们 知道 当前 节点 实际 上 是 一 个 叶 节点 。 此 检查 在 
行 7。 如 果 当前 节点 不 是 叶 节点 ， 请 查找 当前 节点 中 的 运算 待 ， 并 将 其 应 用 于 递归 计算 左右 子 
节点 的 结果 。 


为 了 实现 算术 ， 我 们 使 用 具有 键 '+'，， - ',，'*! 和 '/， 的 字典 。 存 储 在 字典 中 的 值 是 来 自 
Python 的 运单 符 模 块 的 函数 。 运 算 符 模块 为 我 们 提供 了 许多 常用 操作 符 的 功能 。 当 我 们 在 字 
典 中 查找 一 个 运算 符 时 ， 检 索 相 应 的 函数 对 象 。 由 于 检索 的 对 象 是 一 个 函数 ， 我 们 可 以 用 通 
常 的 方式 function(param1 > param2) 调用 它 。 因 此 ， 查 找 opers['+'](2,2) 等 效 


T operator .add(2,2) ° 


def evaluate(parseTree): 
opers = {'+':operator.add, '-':operator.sub, '*':operator.mul, '/':operator.truedi 


v} 


leftC = parseTree.getLeftChild() 
rightC = parseTree.getRightChild() 


if leftcC and rightc: 

fn = opers[parseTree.getRootVal() ] 

return fn(evaluate(leftC),evaluate(rightC) ) 
else: 

return parseTree.getRootval() 


Listing 1 


最 后 ， 我 们 将 跟踪 我 们 在 Figure 4 中 创建 的 分 析 树 上 的 求 值 函数 。 当 我 们 首先 调用 evaluate 
时 ， 我 们 将 整个 树 的 根 作为 参数 parseTree 传递 。 然 后 我 们 获得 对 左 和 右 孩 子 的 引用 ， 以 确 
保 它 们 存在 。 递 归 调 用 发 生 在 第 9 行 。 我 们 首先 在 树 的 根 中 查找 运算 符 ， 它 是 1 o + 
操作 符 映 射 到 operator.add 函数 调用 ， 它 接受 两 个 参数 。 像 Python 函数 调用 一 样 ，Python 
做 的 第 一 件 事 是 计算 传递 给 函数 的 参数 。 在 这 种 情况 下 ， 两 个 参数 都 是 对 我 们 的 evaluate $ 
数 的 递归 有 子 数 调用 。 使 用 从 左 到 右 的 计算 ， 第 一 个 递归 调用 向 左 。 在 第 一 个 递归 调用 中 ， 赋 
值 函 数 给 出 左 子 树 。 我 们 发 现 节 点 没有 左 或 右 孩 子 ， 所 以 我 们 得 到 一 个 叶 节 点 。 当 我 们 在 叶 
节点 时 ， 我 们 只 是 返回 存储 在 叶 节 点 中 的 值 作为 计算 的 结果 。 在 这 种 情况 下 ， 我 们 返回 整数 3 


o 


在 这 一 点 上 ， 我 们 有 一 个 参数 对 operator.add 的 顶层 调用 进行 求 值 。 但 我 们 还 没有 完成 。 继 
续 从 左 到 右 的 参数 计算 ， 我 们 现在 进行 递归 调用 来 评估 根 的 右 孩 子 。 我 们 发 现 节点 有 一 个 左 
和 右 孩 子 ， 所 以 我 们 查找 存储 在 这 个 节点 "运算 符 ， 并 使 用 左 和 右 孩子 作为 参数 调用 此 函数 。 
你 可 以 看 到 ， 两 个 递归 调用 都 到 了 叶 节 点 ， 分 别 计算 结果 为 整数 4 和 5。 使 用 两 个 参数 求 
值 ， 我 们 返回 operator.mul(4,5) 的 结果 。 在 这 一 点 上 ， 我 们 已 经 计算 了 顶级 aw 运算 符 的 
操作 数 ， 剩 下 的 所 有 操作 都 完成 对 operator.add(3,20) 的 调用 。 对 于 ` (3+ (45) ) ` 的 整个 
表达 式 树 的 计算 结果 是 23。 


6.7. 树 的 遍历 


我 们 已 经 见 到 了 树 数据 结构 的 基本 功能 ， 现 在 是 看 树 的 一 些 额外 使 用 模式 的 时 候 了 。 这 些 使 
用 模式 可 以 分 为 我 们 访问 树 节点 的 三 种 方式 。 有 三 种 常用 的 模式 来 访问 树 中 的 所 有 节点 。 这 
些 模 式 之 间 的 差异 是 每 个 节点 被 访问 的 顺序 。 我 们 称 这 种 访问 节点 方式 为 “遍历 ”。 — 
三 种 遍历 方式 称 为 前 序 ， 中 序 和 后 序 。 让 我 们 更 仔细 地 定义 这 三 种 遍历 方式 ， 然 后 看 看 这 
模式 有 用 的 一 些 例 子 


前 序 在 前 序 遍 历 中 ， 我 们 首先 访问 根 节点 ， 然 后 北 归 地 做 左 侧 子 树 的 前 序 遍 历 ， 随 后 是 右 侧 
子 树 的 递归 前 序 遍 历 。 中 序 在 一 个 中 序 遍 历 中 ， 我 们 递归 地 对 左 子 树 进行 一 次 人 遍历， 访问 根 
节点 ， ee 后 序 在 后 序 遍 历 中 ， 我 们 递归 地 对 左 子 树 和 右 子 树 进行 后 序 遍 
历 ， 然 后 访问 根 节 


让 我 们 看 一 些 例子 ， 来 说 明 这 三 种 遍历。 首先 看 前 序 遍历 。 作 为 遍历 的 树 的 示例 ， 我 们 将 把 
这 本 书 表示 为 树 。 这 本 书 是 树 的 根 ， 每 一 章 都 是 根 节点 的 一 个 孩子 。 章 节 中 的 每 个 章节 都 是 
章节 的 子 节点 ， 每 个 小 节 都 是 章节 的 子 节点 ， 依 此 类 推 。Figure 5 展示 了 一 本 只 有 两 章 的 书 
的 有 限 版 本 。 注 意 ， 人 遍历 算法 适用 于 具有 任意 数量 子 节点 的 树 ， 但 是 我 们 现在 使 用 二 又 树 。 





Section 1.2.1 Section 1.2.2 Section 2.2.2 





Figure 5 


假设 你 想 从 前 到 后 读 这 本 书 。 前 序 遍 历 给 你 正确 的 顺序 。 从 树 的 根 (Book 节 点 ) 开始 ， 我 们 
将 遵循 前 序 遍 历 指令 。 我 们 递归 调用 左 孩 子 的 preorder ? 在 这 种 情况 下 是 Chapter1 ° 我 们 
再 次 递归 调用 左 孩 子 的 preorder 来 得 到 section 1.1 。 由 于 section 1.1 没有 子 节点 ， 我 
们 不 再 进行 任何 额外 的 递归 调用 。 当 我 们 完成 Section 1.1 ， 我 们 将 树 向 上 移动 

到 chapter1 。 此 时 ， 我 们 仍然 需要 访问 chapters 的 右 子 树 section 1.2 。 和 前 面 一 样 ， 我 


们 访问 左 子 树 ， 它 将 我 们 带 到 section 1.2.1 ， 然 后 访问 section 1.2.2 ° Æ Section 1.2 
完成 后 ， 我 们 返回 到 chaptera 。 然 后 ， 我 们 返回 到 Book 节点 ， 并 按照 相同 过 程 遍历 
Chapter2 ° 


编写 树 遍 历 的 代码 惊人 地 优雅 ， 主 要 是 因为 遍历 是 递归 写 的 。Listing 2 展示 了 用 于 二 又 树 的 
前 序 遍 历 的 Python 代码 。 


你 可 能 想 知 道 ， 编 写 像 前 序 遍 历 算法 的 最 好 方法 是 什么 ? 是 一 个 简单 地 使 用 树 作 为 数据 结构 
的 函数 ， 还 是 树 数 据 结 构 本 身 的 方法 ?Listing 2 展示 了 作为 外 部 函数 编写 的 前 序 遍 历 的 版 
本 ， 它 将 二 又 树 作 为 参数 。 外 部 函数 特别 优雅 ， 因 为 我 们 的 基本 情况 只 是 检查 树 是 否 存在 。 
如 果树 参数 为 None， 那 么 函数 返回 而 不 采取 任何 操作 。 


def preorder(tree): 
if tree: 
print(tree.getRootVal()) 
preorder(tree.getLeftChild() ) 
preorder(tree.getRightChild()) 


Listing 2 


我 们 也 可 以 实现 preorder 作为 BinaryTree 类 的 方法 。Listing 3 中 展示 了 将 preorder È 

现 为 内 部 方法 的 代码 。 注 意 当 我 们 将 代码 从 内 部 移动 到 外 部 时 会 发 生 什么 。 一 般 来 说 ， 我 们 
REA self 替换 tree 。 但是， 我 们 还 需要 修改 基本 情况 。 内 部 方法 必须 在 进行 前 序 的 递 
归 调 用 之 前 检查 左 和 右 孩 子 的 存在 。 


def preorder(self): 
print(self.key) 
if self.leftChild: 
self.leftChild.preorder() 
if self.rightChild: 
self.rightChild.preorder() 


Listing 3 


以 上 哪 种 方式 实现 前 序 最 好 ? 答案 是 在 这 种 情况 下 ， 实 现 前 序 作为 外 部 函数 可 能 更 好 。 原 因 
是 你 很 少 只 是 想 遍 历 树 。 在 大 多 数 情 况 下 ， 将 要 使 用 其 中 一 个 基本 的 遍历 模式 来 完成 其 他 任 
务 。 事实 上 ， 我 们 将 在 下 面 的 例子 中 看 到 后 序 遍 历 模 式 与 我 们 前 面 编写 的 用 于 计算 分 析 树 的 
代码 非常 接近 。 因此 ， 我 们 用 外 部 函数 实现 其 余 的 遍历 。 


Listing 4 中 所 示 的 后 序 遍 历 算法 几乎 与 前 序 遍 历 顺序 相同 ， 只 是 将 print 调用 移动 到 函数 的 末 
B, o 


def postorder(tree): 
if tree != None: 
postorder(tree.getLeftChild()) 
postorder(tree.getRightChild()) 
print(tree.getRootVal()) 


Listing 4 


我 们 已 经 看 到 了 后 序 遍 历 的 常见 用 法 ， 即 计算 分 析 树 。 再 次 回 到 Listing 1° 我 们 所 做 的 是 计 
算 左 子 树 ， 计 算 右 子 树 ， 并 通过 对 操作 符 的 函数 调用 在 根 节点 中 组 合 它 们 。 假 设 我 们 的 二 又 
树 只 存储 表达 式 树 的 数据 ， 让 我 们 重 写 计算 函数 ， 需 要 更 仔细 地 对 Listing 4 中 的 后 序 遍 历代 
码 进行 建 模 (参见 Listing 5) 。 


def postordereval(tree): 


opers = {'+':operator.add, '-':operator.sub, '*':operator.mul, '/':operator.truedi 
v} 
resi = None 
res2 = None 
if tree: 
resi = postordereval(tree.getLeftChild() ) 
res2 = postordereval(tree.getRightChild() ) 
if resi and res2: 


return opers[tree.getRootVal()](res1, res2) 
else: 


return tree.getRootVal() 


Listing 5 


请 注意 ，Listing 4? HU A ListingS PUBAMA > REE BAH RAAT eR 
Eo 这 人 允许 我 们 保存 从 第 6 行 和 第 7 行 的 递归 调用 返回 的 值 。 然 后 ， 我 们 使 用 这 些 保存 的 值 
以 及 第 9 行 的 运算 符 一 起 计算 结果 。 


在 本 节 中 我 们 最 终 将 看 到 中 序 遍 历 。 在 中 序 遍 历 中 ， 我 们 访问 左 子 树 ， 其 次 是 根 ， 最 后 是 右 
子 树 。 Listing 6 展示 了 我 们 的 中 序 遍历 的 代码 。 注意 ， 在 所 有 三 个 遍历 函数 中 ， 我 们 只 是 改 
变 print 语句 相对 于 两 个 递归 有 函数 调用 的 位 置 。 


def inorder(tree): 
if tree != None: 
inorder(tree.getLeftChild()) 
print(tree.getRootVal()) 
inorder(tree.getRightChild()) 


Listing 6 


如 果 我 们 执行 一 个 简单 的 中 序 遍 历 分 析 树 ， 我 们 得 到 没有 任何 括号 的 原始 表达 式 。 让 我 们 修 
改 基本 的 inorder 算法 ， 以 允许 我 们 恢复 表达 式 的 完全 括号 版 本 。 我 们 将 对 基本 模板 进行 的 
唯一 修改 如 下 : 在 递归 调用 左 子 树 之 前 打印 左 括 号 ， 并 在 递归 调用 右 子 树 后 打印 右 括 号 。 修 
改 后 的 代码 如 Listing 7 所 示 。 


def printexp(tree): 
sVal = "" 
im tree: 
sVal = '(' + printexp(tree.getLeftChild()) 
sVal = sVal + str(tree.getRootVal()) 
sVal = sVal + printexp(tree.getRightChild())+')' 
return sVal 


6.8. 基 于 二 又 堆 的 优先 队列 


在 前 面 的 部 分 中 ， 你 了 解 了 称 为 队列 的 先进 先 出 数据 结构 。 队 列 的 一 个 重要 变种 称 为 优先 级 
队列 。 优 先 级 队列 的 作用 就 像 一 个 队列 ， 你 可 以 通过 从 前 面 删除 一 个 项 目 来 出 队 。 然 而 ， 在 
优先 级 队列 中 ， 队 列 中 的 项 的 逻辑 顺序 由 它们 的 优先 级 确定 。 最 高 优先 级 项 在 队列 的 前 面 ， 
最 低 优 先 级 的 项 在 后 面 。 因 此 ， 当 你 将 项 排 入 优先 级 队列 时 ， 新 项 可 能 会 一 直 移动 到 前 面 。 
我 们 将 在 下 一 章 中 研究 一 些 图 算法 看 到 优先 级 队列 是 有 用 的 数据 结构 。 


你 可 能 想到 了 几 种 简单 的 方法 使 用 排序 函数 和 列表 实现 优先 级 队列 。 然 而 ， 插 入 列表 是 O(n) 
并 且 排 序列 表 是 O(nlogn)。 我 们 可 以 做 得 更 好 。 实 现 优先 级 队列 的 经 典 方 法 是 使 用 称 为 二 又 
堆 的 数据 结构 。 二 又 堆 将 允许 我 们 在 O(logn) 中 排队 和 取出 队列 。 


二 又 堆 是 很 有 趣 的 研究 ， 因 为 堆 看 起 来 很 像 一 棵 树 ， 但 是 当 我 们 实现 它 时 ， 我 们 只 使 用 一 个 
单一 的 列表 作为 内 部 表示 。 二 又 堆 有 两 个 常见 的 变 体 : 最 小 堆 (其 中 最 小 的 键 总 是 在 前 面 ) 

和 最 大 堆 (其 中 最 大 的 键 值 总 是 在 前 面 ) 。 在 本 节 中 ， 我 们 将 实现 最 小 堆 。 我 们 将 最 大 堆 实 
现 作为 练习 。 


6.9. 二 又 堆 操作 


我 们 的 二 又 堆 实现 的 基本 操作 如 下 : 


e BinaryHeap() 创建 一 个 新 的 ， 空 的 二 又 堆 。 

e insert(k) 向 堆 添 加 一 个 新 项 。 

© findMin() 返回 具有 最 小 键 值 的 项 ， 并 将 项 留 在 堆 中 。 

。 delMin() 返回 具有 最 小 键 值 的 项 ， 从 堆 中 删除 该 项 。 

e 如 果 堆 是 空 的 ，isEmpty() 返回 true， 否 则 返回 false ° 

e size() 返回 堆 中 的 项 数 。 

e buildHeap(list) 从 键 列表 构建 一 个 新 的 堆 。 
ActiveCode 1 展示 了 使 用 一 些 二 又 堆 方 法 。 注 意 ， 无 论 我 们 向 堆 中 添加 项 的 顺序 是 什么 ， 每 
次 都 删除 最 小 的 。 我 们 现在 将 把 注意 力 转向 如 何 实现 这 个 想法 。 

from pythonds.trees.binheap import BinHeap 

bh = BinHeap() 

bh.insert(5) 

bh.insert(7) 

bh.insert(3) 

bh.insert(i1) 

print (bh.delMin()) 

print(bh.delMin()) 


print(bh.delMin()) 


print (bh.delMin()) 


6.10. 二 又 堆 实现 


6.10.1. 结 构 属 性 


为 了 使 我 们 的 堆 有 效 地 工作 ， 我 们 将 利用 二 又 树 的 对 数 性 质 来 表示 我 们 的 堆 。 为 了 保证 对 数 
性 能 ， 我 们 必须 保持 树 平衡 。 平 衡 二 又 树 在 根 的 左 和 右 子 树 中 具有 大 致 相同 数量 的 节点 。 在 
我 们 的 堆 实现 中 ， 我 们 通过 创建 一 个 完整 二 又 树 来 保持 树 平衡 。 一 个 完整 的 二 又 树 是 一 个 
树 ， 其 中 每 个 层 都 有 其 所 有 的 节点 ， 除 了 树 的 最 底层 ， 从 左 到 右 卉 充 。 Figure 1 展示 了 完整 
二 又 树 的 示例 。 





Figure 1 


完整 二 又 树 的 另 一 个 有 趣 的 属性 是 ， 我 们 可 以 使 用 单个 列表 来 表示 它 。 我 们 不 需要 使 用 节点 
和 引用 ， 其 至 列表 的 列表 。 因 为 树 是 完整 的 ， 父 节点 的 左 子 节点 (在 位 置 p 处 ) 是 在 列表 中 
位 置 2p 中 找到 的 节点 。 类 似 地 ， 父 节点 的 右 子 节点 在 列表 中 的 位 置 2p + 1°。 为 了 找到 树 中 
任意 节点 的 父 节 点 ， 我 们 可 以 简单 地 使 用 Python 的 整数 除法 。 假定 节点 在 列表 中 的 位 置 n， 
则 父 节 点 在 位 置 n/2。 Figure 2 展示 了 一 个 完整 的 二 又 树 ， 并 给 出 了 树 的 列表 表示 。 请 注意 
父 级 和 子 级 之 间 是 2p 和 2p+1 关系 。 树 的 列表 表示 以 及 完整 的 结构 属性 允许 我 们 仅 使 用 几 个 
简单 的 数学 运算 来 高 效 地 遍历 一 个 完整 的 二 又 树 。 我 们 将 看 到 ， 这 也 是 我 们 的 二 又 堆 的 有 效 
实现 。 


6.10.2. 堆 的 排序 属性 


我 们 用 于 堆 中 存储 项 的 方法 依赖 于 维护 堆 的 排序 属性 。 堆 的 排序 属性 如 下 : 在 堆 中 ， 对 于 具 
AL p 的 每 个 节点 x，p 中 的 键 小 于 或 等 于 X 中 的 键 。Figure 2 展示 了 具有 堆 顺 序 属性 的 完 
整 二 又 树 。 





Figure 2 


6.10.3. 堆 操作 


我 们 将 开始 实现 一 个 二 又 堆 的 构造 函数 。 由 于 整个 二 又 堆 可 以 由 单个 列表 表示 ， 所 以 构造 函 

数 将 初始 化 列表 和 一 个 currentsize 属性 来 跟踪 堆 的 当前 大 小 。 Listing 1 展示 了 构造 函数 的 
Python 代码 。 你 会 注意 到 ， 一 个 空 的 二 又 堆 有 一 个 单一 的 零 作 为 heapList 的 第 一 个 元 素 ， 
这 个 零 只 是 放 那 里 ， 用 于 以 后 简单 的 整数 除法 。 


class BinHeap: 
def __init__(self): 
self.heapList = [0] 
self.currentSize = 0 


Listing 1 


我 们 将 实现 的 下 一 个 方法 是 insert 。 将 项 添加 到 列表 中 最 简单 ， 最 有 效 的 方法 是 将 项 附加 
到 列表 的 末尾 。 它 维护 完整 的 树 属性 。 但 可 能 违反 扒 结构 属性 。 可 以 编写 一 个 方法 ， 通 过 比 
较 新 添加 的 项 与 其 父 项 ， 我 们 可 以 重新 获得 堆 结构 属性 。 如 果 新 添加 的 项 小 于 其 父 项 ， 则 我 
们 可 以 将 项 与 其 父 项 交换 。Figure 2 展示 了 将 新 添加 的 项 蔡 换 到 其 在 树 中 的 适当 位 置 所 需 的 
操作 。 


6.10. 二 又 堆 实现 


new item 








Figure 2 


注意 ， 当 我 们 完成 一 个 项 时 ， 我 们 需要 恢复 新 添加 的 项 和 父 项 之 间 的 堆 属 性 。 我 们 还 需 保留 
任何 兄弟 节点 的 堆 属 性 。 当 然 ， 如 果 新 添加 的 项 非常 小 ， 我 们 可 能 仍 需 要 将 其 交换 另 一 上 
层 。 事 实 上 ， 我 们 可 能 需要 交换 到 树 的 顶部 。 Listing 2 展示 了 percup 方法 ， 它 在 树 中 向 上 
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遍历 一 个 新 项 ， 因 为 它 需 要 去 维护 堆 属 性 。 注意， 我们 可 以 通过 使 用 简单 的 整数 除法 来 计划 
任意 节点 的 父 节点 。 当前 节点 的 父 节点 可 以 通过 将 当前 节点 的 索引 除 以 2 来 计算 。 


我 们 现在 可 以 编写 insert FAT ( 见 Listing 3) 。 播 入 方法 中 的 大 部 分 工作 都 是 由 
percup 完成 的 。 一 旦 一 个 新 项 被 追加 到 树 上 ， percup 接管 并 正确 定位 新 项 。 


def percUp(self,i): 
while i // 2 > 0: 
if self.heapList[i] < self.heapList[i // 2]: 
tmp = self.heapList[i // 2] 
self.heapList[i // 2] = self.heapList[i] 
self.heapList[i] = tmp 
i=i//2 


Listing 2 


def insert(self,k): 
self .heapList.append(k) 
self.currentSize = self.currentSize + 1 
self.percUp(self.currentSize) 


Listing 3 


使 用 正确 定义 的 insert 方法 ， 我 们 现在 可 以 看 delMin 方法 。 因 为 堆 属性 要 求 树 的 根 是 树 
中 的 最 小 项 ， 所 以 找到 最 小 项 很 容易 。 delMin 的 难点 在 根 被 删除 后 恢复 堆 结构 和 堆 顺 序 属 

性 。 我 们 可 以 分 两 步 恢 复 我 们 的 堆 。 首 先 ， 我 们 将 通过 获取 列表 中 的 最 后 一 个 项 并 将 其 移动 
到 根 位 置 来 恢复 根 项 ， 保 持 我 们 的 堆 结构 属性 。 但是， 我 们 可 能 已 经 破坏 了 我 们 的 二 又 堆 的 


堆 顺 序 属性 。 第 二 ， 我 们 通过 将 新 的 根 节 点 沿 着 树 向 下 推 到 其 正确 位 置 来 恢复 扒 顺序 属性 。 
Figure 3 展示 了 将 新 的 根 节点 移动 到 堆 中 的 正确 位 置 所 需 的 交换 序列 。 ee 


6.10. 二 又 堆 实现 
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Figure 3 


为 了 维护 扒 顺序 属性 ， 我 们 所 需要 做 的 是 将 根 节 点 和 最 小 的 子 节点 交换 。 在 初始 交换 之 后 ， 
我 们 可 以 将 节点 和 其 子 节点 重复 交换 ， 直 到 节点 被 交换 到 正确 的 位 置 ， 使 它 小 于 两 个 子 节 
点 。 树 交换 节点 的 代码 可 以 在 Listing 4 中 的 percDpown 和 minchild 方法 中 找到 。 


def percDown(self,i): 
while (i * 2) <= self.currentSize: 

mc = self.minChild(i) 

if self.heapList[i] > self.heapList[mc]: 
tmp = self.heapList[i] 
self.heapList[i] = self.heapList[mc] 
self.heapList[mc] = tmp 

i = mc 


def minChild(self,i): 
if i* 2+ 1> self.currentSize: 
return i * 2 
else: 
if self.heapList[i*2] < self.heapList[i*2+1]: 
return i * 2 
else: 
return i * 2+1 


Listing 4 


delmin 操作 的 代码 在 Listing 5 中 。 注 意 ， 有 难度 的 工作 由 辅助 函数 处 理 ， 在 这 种 情况 下 是 


percDown ° 


def delMin(self): 
retval = self.heapList[1] 
self.heapList[1] = self.heapList[self.currentSize] 
self.currentSize = self.currentSize - 1 
self.heapList.pop() 
self.percDown(1) 
return retval 


Listing 5 


为 了 完成 我 们 对 二 又 堆 的 讨论 ， 我 们 将 看 从 一 个 列表 构建 整个 堆 的 方法 。 你 可 能 想到 的 第 一 
种 方法 如 下 所 示 。 给 定 一 个 列表 ， 通 过 一 次 插入 一 个 键 轻松 地 构建 一 个 堆 。 由 于 你 从 一 个 项 
的 列表 开始 ， 该 列表 是 有 序 的 ， 可 以 使 用 二 分 查找 找到 正确 的 位 置 ， 以 大 约 O(logAn ) 操作 的 
成 本 插入 下 一 个 键 。 但 是 ， 请 记 住 ， 在 列表 中 间 插 入 项 可 能 需要 O(n) 操作 来 移动 列表 的 其 余 
部 分 ， 为 新 项 腾 出 空间 。 因 此， 要 在 堆 中 插入 n 个 键 ， 将 需要 总 共 O(nlogn) 操作 。 然而 ， 
如 果 我 们 从 整个 列表 开始 ， 那 么 我 们 可 以 在 O(n) 操作 中 构建 整个 堆 。Listing 6 展示 了 构建 整 
个 堆 的 代码 。 


def buildHeap(self,alist): 
i = len(alist) // 2 
self.currentSize = len(alist) 
self.heapList = [0] + alist[:] 
while (i > 0): 
self .percDown(i) 


Lanan 
Listing 6 

Initial Heap iz2 i=1 
Figure 4 


Figure 4 展示 了 buildHeap 方法 在 [9,6,5,2,3] 的 初始 树 中 的 节点 移动 到 其 正确 位 置 时 所 做 
的 交换 。 虽 然 我 们 从 树 的 中 间 开 始 ， 并 以 我 们 的 方式 回 到 根 节点 ， percdown 方法 确保 最 大 的 
子 节 点 总 是 沿 着 树 向 下 移动 。 因 为 堆 是 一 个 完整 的 二 又 树 ， 超 过 中 途上 点 的 任何 节点 都 将 是 树 
叶 ， 因 此 没有 子 节 点 。 注 意 ， 当 i = 1 时 ， 我 们 从 树 的 根 节 点 向 下 交换 ， 因 此 可 能 需要 多 次 
交换 。 正 如 你 在 Figure 4 最 右边 的 两 个 树 中 可 以 看 到 的 ， 首 先 9 从 根 位 置 移 出 ， 但 是 9 在 树 
中 向 下 移动 一 级 之 后 ， percDown 检查 下 一 组 子 树 ， 以 确保 它 被 推 到 下 一 层 。 在 这 种 情况 下 ， 
它 与 3 进行 第 二 次 交换 。 现 在 9 已 经 移动 到 树 的 最 低层 ， 不 能 进行 进一步 交换 。 将 Figure 4 
所 示 的 这 一 系列 交换 的 列表 与 树 进 行 比较 是 有 用 的 。 
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完整 二 又 堆 代 码 实 现 见 activecode 1 


class BinHeap: 
def __init__(self): 
self.heapList = [0] 
self.currentSize = 0 


def percUp(self,i): 
while i // 2 > 0: 
if self.heapList[i] < self.heapList[i // 2]: 
tmp = self.heapList[i // 2] 
self.heapList[i // 2] = self.heapList[i] 
self.heapList[i] = tmp 
i=i//2 


def insert(self,k): 
self .heapList.append(k) 
self.currentSize = self.currentSize + 1 
self .percUp(self.currentSize) 


def percDown(self,i): 
while (i * 2) <= self.currentSize: 
mc = self.minChild(i) 
if self.heapList[i] > self.heapList[mc]: 
tmp = self.heapList[i] 
self.heapList[i] = self.heapList[mc] 
self.heapList[mc] = tmp 
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def minChild(self,i): 
if i * 2+ 1 > self.currentSize: 
return i * 2 
else: 
if self.heapList[i*2] < self.heapList[i*2+1]: 
return i * 2 
else: 
return i * 2+1 


def delMin(self): 
retval = self.heapList[1] 
self .heapList[1] = self.heapList[self.currentSize] 
self.currentSize = self.currentSize - 1 
self .heapList.pop() 
self .percDown(1) 
return retval 


def buildHeap(self,alist): 
i = len(alist) // 2 
self.currentSize = len(alist) 
self.heapList = [0] + alist[:] 
while (i > 0): 
self .percDown(i) 
i=i-1 


bh = BinHeap() 
bh. buildHeap([9,5,6,2,3]) 


print(bh.delMin()) 
print(bh.delMin()) 


print(bh.delMin() ) 
print(bh.delMin()) 
print(bh.delMin()) 


ActiveCode 1 


我 们 可 以 在 O(n) 中 构建 堆 的 断言 可 能 看 起 来 有 点 神秘 ， 证 明 超 出 了 本 书 的 范围 。 然而， 理解 
的 关键 是 记 住 log^n 因子 是 从 树 的 高 度 派生 的 。 对 于 buildHeap 中 的 大 部 分 工作 ， 树 比 
log^n 短 。 


基于 可 以 从 O(n) 时 间 构 建 堆 的 事实 ， 你 可 以 使 用 堆 对 列表 在 O(nlogn) 时 间 内 排序 ， 作 为 本 
章 结尾 的 练习 。 


6.11. 二 又 查找 树 


我 们 已 经 看 到 了 两 种 不 同 的 方法 来 获取 集合 中 的 键 值 对 。 回 想 一 下 ， 这 些 集合 实现 了 map 4 
象 数 据 类 型 。 我 们 讨论 的 map ADT 的 两 个 实现 是 在 列表 和 哈 希 表 上 的 二 分 搜索 。 在 本 节 

中 ， 我 们 将 研究 二 又 查找 树 作 为 从 键 映射 到 值 的 另 一 种 方法 。 在 这 种 情况 下 ， 我 们 对 树 中 项 
的 确切 位 置 不 感 兴趣 ， 但 我 们 有 兴趣 使 用 二 又 树 结构 来 提供 高 效 的 搜索 。 


6.12. 查 找 树 操作 


在 我 们 看 实现 之 前 ， 先 来 看 看 map ADT 提供 的 接口 。 你 会 注意 到 ， 这 个 接口 与 Python 字典 
非常 相似 。 


e Map() 创建 一 个 新 的 空 map ° 

e put(key > val) 向 map 中 添加 一 个 新 的 键 值 对 。 如 果 键 已 经 在 map 中 ， 那 么 用 新 值 替换 
旧 值 。 

e get(key) 给 定 一 个 键 ， 返 回 存储 在 map 中 的 值 ， 否则 为 None。 

e del 使 用 del map[key] 形式 的 语句 从 map 中 删除 键 值 对 。 

© len() 返回 存储 在 映射 中 的 键 值 对 的 数量 。 

e in 返回 True 如 果 给 定 的 键 在 map 中 。 


6.13. 查 找 树 实现 


二 又 搜索 树 依赖 于 在 左 子 树 中 找到 的 键 小 于 父 节 点 的 属性 ， 并 且 在 右 子 树 中 找到 的 键 大 于 父 
Ro 我 们 将 这 个 称 为 bst 属 性 。 当 我 们 如 上 所 Map 接口 时 ，bst 属性 将 指导 我 们 的 实 
IL o Figure 1 说 明了 二 又 搜索 树 的 此 属性 ， 展 示 了 没有 任何 关联 值 的 键 。 请 注意 ， 该 属性 适 
用 于 每 个 父 级 和 子 级 。 堪 子 树 中 的 所 有 键 小 于 根 中 的 键 。 右 子 树 中 的 所 有 键 都 大 于 根 。 





Figure1 


现在 你 知道 什么 是 二 又 搜索 树 ， se a ote 
按照 所 示 的 顺序 插入 以 下 键 之 后 存在 的 节点 : 70,31,93,94,14,23,73 。 因 为 70 是 插入 树 中 的 
第 一 个 键 ， 它 是 根 。 接 下 来 ，31 小 于 70， 所 以 它 成 为 70 的 左 孩 子 。 接 下 来 ，93 大 于 70， 
所 以 它 成 为 70 的 右 孩 子 。 现 在 我 们 有 两 层 的 树 填 充 ， 所 以 下 一 个 键 94 ， 因 为 94 大 于 70 和 
93， 它 成 为 93 的 右 孩 子 。 类 似 地 ，14 小 于 70 和 31， 所 以 它 变 成 31 的 堪 孩 子 。23 也 小 于 
31， 所 以 它 必须 在 左 子 树 31 中 。 但 是 ， 它 大 于 14， 所 以 它 成 为 14 的 右 孩 子 。 


为 了 实现 二 又 搜索 树 ， 我 们 将 使 用 类 似 于 我 们 用 于 实现 链表 的 节点 和 引用 方法 ， 以 及 表达 式 
树 。 但 是 ， 因 为 我 们 必须 能 够 创建 和 使 用 一 个 空 的 二 又 搜索 树 ， 我 们 的 实现 将 使 用 两 个 类 。 
第 一 个 类 称 为 BinarySearchTree ， 第 二 个 类 称 为 TreeNode 。 BinarySearchTree 类 具有 对 作 
为 二 又 搜索 树 的 根 的 TreeNode 的 引用 。 在 大 多 数 情 况 下 ， 外 部 类 中 定义 的 外 部 方法 只 是 检查 
树 是 否 为 室 。 如 果树 中 有 节点 ， 请 求 只 是 传递 到 BinarysearchTree 类 中 定义 的 私有 方法 ， 该 
方法 以 root 作为 参数 。 在 树 是 空 的 或 者 我 们 想 要 删除 树 根 的 键 的 情况 下 ， 我 们 必须 采取 特殊 
的 行动 。 BinarySearchTree 类 构造 函数 的 代码 以 及 一 些 其 他 杂项 函数 如 Listing 1 所 示 。 


class BinarySearchTree: 


def _ init__(self): 
self.root = None 
self.size = 0 


def length(self): 
return self.size 


def _ Jen (self): 
return self.size 


def _iter_ (self): 
return self.root.__iter__() 


Listing 1 


TreeNode 类 提供 了 许多 辅助 函数 ， 使 得 在 BinarysearchTree 类 方法 中 完成 的 工作 更 容易 。 

TreeNode 8) #438 HAVA Rik Hk HH Bh HA to Listing 2 所 示 。 你 可 以 在 列表 中 看 到 许多 辅助 函数 
根据 自己 的 位 置 将 节点 分 类 为 子 节点 (AXA) 和 节点 具有 的 子 节点 类 型 。 TreeNode 类 还 
将 显 式 地 跟踪 父 节点 作为 每 个 节点 的 属性 。 当 我 们 讨论 del 操作 符 的 实现 时 ， 你 会 看 到 为 什么 
这 很 重要 。 


Listing 2 中 TreeNode 另 一 个 有 趣 的 方面 是 我 们 使 用 Python 的 可 选 参数 。 可 选 参数 使 我 们 能 
够 在 几 种 不 同 的 情况 下 轻松 创建 TreeNode 。 有 时 我 们 想 要 构造 一 个 已 经 同时 具有 父 和 子 的 
新 TreeNode 。 对 于 现 有 的 父 和 子 ， 我 们 可 以 传递 父 和 子 作 为 参数 。 在 其 他 时 候 ， 我 们 将 使 
用 键 值 对 创建 一 个 TreeNode ， 我 们 不 会 为 父 或 子 传 递 任何 参数 。 在 这 种 情况 下 ， 将 使 用 可 选 
参数 的 默认 值 。 


Class TreeNode : 
def init__(self, key, val, left=None, right=None, 
parent=None): 
self.key = key 
self.payload = val 
self.leftChild = left 
self.rightChild = right 
self.parent = parent 


def hasLeftChild(self): 
return self.leftChild 


def hasRightChild(self): 
return self.rightChild 


defeaskegechila(selty: 
return self.parent and self.parent.leftChild == self 


def isRightChild(self): 
return self.parent and self.parent.rightChild == self 


def isRoot(self): 
return not self.parent 


def isLeaf (self): 
return not (self.rightChild or self.leftChild) 


def hasAnyChildren(self): 
return self.rightChild or self.leftChild 


def hasBothChildren(self): 
return self.rightChild and self.leftChild 


def replaceNodeData(self, key, value,1c,rc): 

self.key = key 

self.payload = value 

self.leftChild = lc 

self.rightChild = rc 

if self.hasLeftChild(): 
self.leftChild.parent = self 

if self.hasRightChild(): 
self.rightChild.parent = self 


Listing 2 


现在 我 们 有 了 BinarySearchtree shell 和 TreeNode ， 现 在 是 时 候 编写 put 方法 ， 这 将 允许 
我 们 构建 二 又 搜索 树 。 put 方法 是 BinarySearchtree 类 的 一 个 方法 。 此 方法 将 检查 树 是 否 
已 具有 根 9 如 果 没 有 根 ， 那 么 put 将 创建 一 个 新 的 TreeNode 并 将 其 做 为 树 的 根 R 如 果 根 节 
点 已 经 就 位 ， 则 put 调用 私有 递归 辅助 函数 put 根据 以 下 算法 搜索 树 : 


© 从 树 的 根 开始 ， 搜 索 二 又 树 ， 将 新 键 与 当前 节点 中 的 键 进行 比较 。 如 果 新 键 小 于 当前 节 
点 ， 则 搜索 左 子 树 。 如 果 新 键 大 于 当前 节点 ， 则 搜索 右 子 树 。 

o 当 没 有 左 (或 右 ) 孩子 要 搜索 时 ， 我 们 在 树 中 找到 应 该 建立 新 节点 的 位 置 。 

e@ 要 向 树 中 添加 节点 ， 请 创建 一 个 新 的 TreeNode 对 象 ， 并 将 对 象 播 入 到 上 一 步 发 现 的 节 
Oe 


Listing 3 展示 了 在 树 中 插入 一 个 新 节点 的 Python 代码 。 put 函数 按照 上 述 步骤 递归 编写 。 
请 注意 ， 当 一 个 新 的 子 节点 插入 到 树 中 时 ” currentNode 将 作为 父 节 点 传递 给 新 的 树 节 点 。 


我 们 实现 插入 的 一 个 重要 问题 是 重复 的 键 不 能 正确 处 理 。 当 我 们 的 树 被 实现 时 ， 重 复 键 将 在 
具有 原始 键 的 节点 的 右 子 树 中 创建 具有 相同 键 值 的 新 节点 。 这 样 做 的 结果 是 ， 具 有 新 键 的 节 
点 将 永远 不 会 在 搜索 期 间 被 找到 。 处 理 插入 重复 键 的 更 好 方法 是 将 新 键 相关 联 的 值 替 换 旧 
值 。 我 们 将 修复 这 个 bug 作 为 练习 。 


def put(self,key,val): 
if self.root: 
self._put(key, val, self.root) 
else: 
self.root = TreeNode(key, val) 
self.size = self.size + 1 


def _put(self, key, val, currentNode): 
if key < currentNode.key: 
if currentNode.hasLeftChild(): 
self._put(key, val, currentNode.leftChild) 
else: 
currentNode.leftChild = TreeNode(key, val, parent=currentNode) 
else: 
if currentNode.hasRightChild(): 
self._put(key, val, currentNode. rightChild) 
else: 
currentNode.rightChild = TreeNode(key, val, parent=currentNode) 


Listing 3 


当 put 方法 定义 后 ， 我 们 可 以 通过 使 用 _setitem 方法 调用 (参见 Listing4 ) put 方 
法 来 重 载 赋值 的 [] 运算 符 。 这 使 得 我 们 可 以 编写 像 myziptree['Plymouth'] = 55446 这 样 的 
Python 7 4) > #£4% Python 字典 一 样 。 


def _ setitem (self,k,v): 
self.put(k,v) 


Listing 4 


Figure 2 展示 了 用 于 将 新 节点 插入 二 又 搜索 树 的 过 程 。 浅 阴影 的 节点 指示 在 插入 过 程 期 间 访 
问 的 节点 。 





/ 
/ 
/ 
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Figure 2 


一 旦 树 被 构造 ， 下 一 个 任务 是 实现 对 给 定 键 的 值 的 检索 。 get AA put 方法 更 容易 ， 
为 它 只 是 递归 地 搜索 树 ， 直 到 它 到 达 不 匹配 的 叶 节 点 或 找到 匹配 的 键 。 当 找到 匹配 的 键 时 ， 
返回 存储 在 节点 的 有 效 载 荷 中 的 值 。 


Listing 5 展示 了 get ， get 和 _getitem_ RAB get 方法 中 的 搜索 代码 使 用 和 
put 相同 的 逻辑 来 选择 左 或 右 子 节点 。 请 注意 ，_get 方法 返回 一 个 TreeNode ， 这 允许 
_get 用 作 其 他 BinarysearchTree 方法 的 一 个 灵活 的 辅助 方法 ， 可 能 需要 利用 除了 有 效 载荷 
之 外 的 TreeNode 的 其 他 数据 。 


通过 实现 _getitem 方法， 我 们 可 以 编写 一 个 类 似 于 访问 字典 的 Python 语句 ， 而 实际 上 
我 们 使 用 的 是 二 又 搜索 树 ， 例 如 z = myzipTree ['Fargo'] 。 正 如 你 所 看 到 的 ， 所 有 的 
_ getitem_ 方法 都 是 调用 get ° 


def get(self, key): 
if self.root: 
res = self._get(key,self.root) 
if res: 
return res.payload 
else: 
return None 
else: 
return None 


def _get(self, key, currentNode): 
if not currentNode: 
return None 
elif currentNode.key == key: 
return currentNode 
elif key < currentNode.key: 
return self._get(key, currentNode.leftChild) 
else: 
return self._get(key, currentNode. rightChild) 


def _ getitem (self, key): 
return self.get(key) 


Listing 5 


使 用 get ， 我 们 可 以 通过 为 BinarySearchtree 写 一 个 _contains ”方法 来 实现 in 操作。 
__contains__ 方法 将 简单 地 调用 get 并 在 get 返回 值 时 返回 True， 如 果 返 回 None 则 返 
回 False。 contains 4) 7X43 4eListing 6 所 示 。 


def _ contains_ (self, key): 
if self._get(key,self.root): 
return True 
else: 
return False 


Listing 6 


回想 一 下 ， contains ERT in HEH? AHRNE ETEA: 


if 'Northfield' in myZipTree: 
print("oom ya ya") 


最 后 ， 我 们 将 注意 力 转 向 二 又 搜索 树 中 最 具 挑 战 性 的 方法 ， 删 除 一 个 键 (参见 Listing 7) ° 
第 一 个 任务 是 通过 搜索 树 来 找到 要 删除 的 节点 。 如 果树 具有 多 个 节点 ， 我 们 使 用 get 方法 
搜索 以 找到 需要 删除 的 TreeNode 。 如 果树 只 有 一 个 节点 ， 这 意味 着 我 们 删除 树 的 根 ， 但 是 


我 们 仍然 必须 检查 以 确保 根 的 键 匹配 要 删除 的 键 。 在 任 一 情况 下 ， 如 果 未 找到 键 ， del 操作 
符 将 引发 错误 。 


def delete(self, key): 
if self.size > 1: 
nodeToRemove = self._get(key,self.root) 
if nodeToRemove: 
self .remove(nodeToRemove ) 
self.size = self.size-1 
else: 
raise KeyError('Error, key not in tree') 
elif self.size == 1 and self.root.key == key: 
self.root = None 
self.size = self.size - 1 
else: 


raise KeyError('Error, key not in tree') 


def _ delitem (self, key): 
self.delete(key) 


Listing 7 
一 旦 我 们 找到 了 我 们 要 删除 的 键 的 节点 ， 我 们 必须 考虑 三 种 情况 : 


1. 要 删除 的 节点 没有 子 节点 (参见 Figure 3) 。 
2. 要 删除 的 节点 只 有 一 个 子 节点 ( 见 Figure 4) ° 
3. 要 删除 的 节点 有 两 个 子 节点 ( 见 Figure 5) ° 


第 一 种 情况 很 简单 (I Listing 8) 。 如 果 当 前 节点 没有 子 节点 ， 我 们 需要 做 的 是 删除 节点 并 
删除 对 父 节 点 中 该 节点 的 引用 。 此 处 的 代码 如 下 所 示 。 


if currentNode.isLeaf(): 
if currentNode == currentNode.parent.leftChild: 
currentNode.parent.leftChild = None 
else: 
currentNode.parent.rightChild = None 


Listing 8 





Figure 3 


第 二 种 情况 只 是 稍微 复杂 一 点 ( 见 Listing9) 。 如 果 一 个 节点 只 有 一 个 孩子 ， 那 么 我 们 可 以 
简单 地 促进 孩子 取代 其 父 。 此 案例 的 代码 展示 在 下 一 个 列表 中 。 当 你 看 这 个 代码 ， 你 会 看 到 
有 六 种 情况 要 考虑 。 由 于 这 些 情况 相对 于 左 孩 子 或 右 孩 子 对 称 ， 我 们 将 仅 讨 论 当 前 节点 具有 
左 孩 子 的 情况 。 决 策 如 下 : 


1. 如果 当前 节点 是 左 子 节 点 ， 则 我 们 只 需要 更 新 左 子 节点 的 父 引 用 以 指向 当前 节点 的 父 节 
点 ， 然 后 更 新 父 节点 的 左 子 节点 引用 以 指向 当前 节点 的 左 耶 节 点 。 

2. 如果 当 前 节点 是 右 子 节点 ， 则 我 们 只 需要 更 新 左 子 节点 的 父 引 用 以 指向 当前 节点 的 父 节 
点 ， 然 后 更 新 父 节 ical 点 引用 以 指向 当前 节点 的 左 子 节点 。 

3， 如 果 当 前 节点 没有 父 级 ， 则 它 是 根 。 在 这 种 情况 下 ， 我 们 将 通过 在 根 上 调 
用 replaceNodeData 方法 来 替换 key ， payload ， leftchild 和 rightchild 数据 。 


else: # this node has one child 
if currentNode.hasLeftChild(): 
if currentNode.isLeftChild(): 
currentNode.leftChild.parent = currentNode.parent 


currentNode.parent.leftChild = currentNode.leftChild 
elif currentNode.isRightChild(): 


currentNode.leftChild.parent = currentNode.parent 
currentNode.parent.rightChild = currentNode.leftChild 
else: 
currentNode. replaceNodeData(currentNode.leftChild.key, 
currentNode. leftChild. payload, 
currentNode.leftChild.leftChild, 


currentNode. leftChild. rightChild) 
else: 


if currentNode.isLeftChild(): 
currentNode.rightChild.parent = currentNode. parent 
currentNode.parent.leftChild = currentNode.rightChild 

elif currentNode.isRightChild(): 
currentNode.rightChild.parent = currentNode. parent 


currentNode.parent.rightChild = currentNode.rightChild 
else: 


currentNode. replaceNodeData(currentNode. rightChild.key, 
currentNode. rightChild. payload, 
currentNode.rightChild.leftChild, 
currentNode. rightChild. rightChild) 


Listing 9 


Figure 4 


第 三 种 情况 是 最 难处 理 的 情况 〈 见 Listing 10) 。 如 果 一 个 节点 有 两 个 孩子 ， 那 么 我 们 不 太 可 
能 简单 地 提升 其 中 一 个 节点 来 占据 节点 的 位 置 。 然 而， 我 们 可 以 在 树 中 搜索 可 用 于 替换 被 调 
度 删除 的 节点 的 节点 。 我 们 需要 的 是 一 个 节点 ， 它 将 保留 现 有 的 堪 和 右 子 树 的 二 又 搜索 树 关 


Ao 执行 此 操作 的 节点 是 树 中 具有 次 最 大 键 的 节点 。 我 们 将 这 个 节点 称 为 后 继 节点 ， 我 们 将 
看 一 种 方法 来 很 快 找到 后 继 节 点 。 继承 节点 保证 没有 多 于 一 个 孩子 ， 所 以 我 们 知道 使 用 已 经 
实现 的 两 种 情况 删除 它 。 一 旦 删除 了 后 继 ， 我 们 只 需 将 它 放 在 树 中 ， 代 替 要 删除 的 节点 。 





Figure 5 


处 理 第 三 种 情况 的 代码 展示 在 下 一 个 列表 中 。 注意 ， 我 们 使 用 辅助 方法 findsuccessor 和 
findMin 来 找到 后 继 。 要 删除 后 继 ， 我 们 使 用 spliceout 方法 。 我 们 使 用 spliceout 的 原 
因 是 它 直接 找到 我 们 想 要 拼接 的 节点 ， 并 做 出 正确 的 更 改 。 我 们 可 以 递归 调用 删除 ， 但 是 我 
们 将 浪费 时 间 重 新 搜索 关键 节点 。 


elif currentNode.hasBothChildren(): #interior 
succ = currentNode.findSuccessor() 
succ.spliceOut() 
currentNode.key = succ.key 
currentNode.payload = succ.payload 


Listing 10 


找到 后 继 的 代码 如 下 所 示 ( 见 Listing 11) > Æ TreeNode 类 的 一 个 方法 。 此 代码 利用 二 又 搜 
索 树 的 相同 属性 ， 采 用 中 序 遍 历 从 最 小 到 最 大 打印 树 中 的 节点 。 在 寻找 接班 人 时 ， 有 三 种 情 
况 需要 考虑 : 


1， 如 果 节 点 有 右 子 节点 ， 则 后 继 节点 是 右 子 树 中 的 最 小 的 键 。 

2， 如 果 节 点 没有 右 子 节点 并 且 是 父 节 点 的 左 子 节点 ， 则 父 节 点 是 后 继 节 点 。 

3. 如 果 节 点 是 其 父 节点 的 右 子 节点 ， 并 且 它 本 身 没有 右 子 节点 ， 则 此 节点 的 后 继 节点 是 其 
父 节点 的 后 继 节点 ， 不 包括 此 节点 。 


第 一 个 条 件 是 对 于 我 们 从 二 又 搜索 树 中 删除 节点 时 唯一 重要 的 条 件 。 但 是 ， findsuccessor 
方法 具有 其 他 用 法 ， 我 们 将 在 本 章 结尾 的 练 1 ipa ¢ 


调用 findMin 方法 来 查找 子 树 中 的 最 小 键 。 你 应 该 说 服 自己 ， 任 何 二 又 搜索 树 中 的 最 小 值 键 
是 树 的 最 左 子 节点 。 因 此 ， findMin 方法 简单 地 循环 子 树 的 每 个 节点 中 的 leftchild 引用 ， 
直到 它 到 达 没 有 左 子 节点 的 节点 。 


def findSuccessor(self): 
succ = None 
if self.hasRightChild(): 
succ = self.rightChild.findMin( ) 
else: 
if self.parent: 
if self.isLeftChild(): 
succ = self.parent 
else: 
self.parent.rightChild = None 
succ = self.parent.findSuccessor() 
self.parent.rightChild = self 
return succ 


def findMin(self): 
current = self 
while current.hasLeftChild(): 
current = current.leftChild 
return current 


def spliceOut(self): 
if self.isLeaf(): 
if self.isLeftChild(): 
self.parent.leftChild = None 
else: 
self.parent.rightChild = None 
elif self.hasAnyChildren(): 
if self .hasLeftChild(): 
if self.isLeftChild(): 
self.parent.leftChild = self.leftChild 
else: 
self.parent.rightChild = self.leftChild 
self.leftChild.parent = self.parent 
else: 
if self.isLeftChild(): 
self.parent.leftChild = self.rightChild 
else: 
self.parent.rightChild = self.rightChild 
self.rightChild.parent = self.parent 


Listing 11 


我 们 需要 查看 二 又 搜索 树 的 最 后 一 个 接口 方法 。 假 设 我 们 想 要 按 中 序 遍 历 树 中 的 所 有 键 。 我 
人 首 如 何 使 用 中 序 遍 历 算 法 按 顺序 遍历 二 又 树 。 然 
而 ， 编 写 迭 代 器 需要 更 多 的 工作 ， 因 为 迭代 器 在 每 次 调用 迭代 器 时 只 返回 一 个 节点 。 


Python 为 我 们 提供 了 一 个 非常 强大 的 防 数 ， 在 创建 迭代 器 时 使 用 。 该 函数 称 为 yield ° 
yield RMT return ， 因 为 它 向 调用 者 返回 一 个 值 。 然 而 ，yield 采取 冻结 函数 状态 的 附加 

步 又， 使 得 下 一 次 调用 有 函数 时 ， 它 从 其 早先 停止 的 确切 点 继续 执行 。 创 建 可 以 迭代 的 对 象 的 
函数 称 为 生成 函数 。 


二 又 树 的 inorder 迭代 器 的 代码 展示 在 下 一 个 列表 中 。 人 和 仔细 看 看 这 段 代码 ;年 一 看 ， 你 可 能 认 
为 代码 不 是 递归 的 。 但 是 ， 请 记 住 ， iter 覆盖 for x in 操作 ， 因 此 它 是 递归 的 1 因为 
它 是 在 TreeNode 实例 上 递归 的 ? 所 /en 方法 在 TreeNode 类 中 定义 p 


def _ iter _ (self): 
if self: 
if self.hasLeftChild(): 
for elem in self.leftChild: 
yield elem 
yield self.key 
if self.hasRightChild(): 
for elem in self.rightChild: 
yield elem 


此 时 ， 可 能 需要 下 载 包 完整 版 本 的 BinarySearchTree 和 TreeNode 类 的 整个 文件 。 


class TreeNode: 
def _ init__(self, key, val, left=None, right=None, parent=None): 
self.key = key 
self.payload = val 
self.leftChild = left 
self.rightChild = right 
self.parent = parent 


def hasLeftChild(self): 
return self.leftChild 


def hasRightChild(self): 
return self.rightChild 


def isLeftChild(self): 
return self.parent and self.parent.leftChild == self 


def isRightChild(self): 
return self.parent and self.parent.rightChild == self 


def isRoot(self): 
return not self.parent 


def isLeaf(self): 


def 


def 


def 


return not (self.rightChild or self.leftChild) 


hasAnyChildren(self): 
return self.rightChild or self.leftChild 


hasBothChildren(self): 
return self.rightChild and self.leftChild 


replaceNodeData(self, key, value,1c,rc): 

self.key = key 

self.payload = value 

self.leftChild = lc 

self.rightChild = rc 

if self .hasLeftChild(): 
self.leftChild.parent = self 

if self .hasRightChild(): 
self.rightChild.parent = self 


class BinarySearchtTree: 


def 


def 


def 


def 


def 


def 


__init__(self): 
self.root = None 
self.size = 0 


length(self): 
return self.size 


__len__(self): 
return self.size 


put(self, key, val): 
if self.root: 
self._put(key, val, self.root) 
else: 
self.root = TreeNode(key, val) 
self.size = self.size + 1 


_put(self, key, val, currentNode): 
if key < currentNode.key: 
if currentNode.hasLeftChild(): 


self._put(key, val, currentNode.leftChild) 


else: 


currentNode.leftChild = TreeNode(key, val, parent=currentNode) 


else: 
if currentNode.hasRightChild(): 


self._put(key, val, currentNode. rightChild) 


else: 


currentNode.rightChild = TreeNode(key, val, parent=currentNode) 


__setitem_(self,k,v): 
self.put(k,v) 


def get(self, key): 
if self.root: 
res = self._get(key, self.root) 
if res: 
return res.payload 
else: 
return None 
else: 
return None 


def _get(self, key, currentNode): 
if not currentNode: 
return None 
elif currentNode.key == key: 
return currentNode 
elif key < currentNode.key: 
return self._get(key, currentNode. leftChild) 
else: 
return self._get(key,currentNode.rightChild) 


def _ getitem (self, key): 
return self.get(key) 


def _ contains_ (self, key): 
if self._get(key,self.root): 
return True 
else: 
return False 


def delete(self, key): 
if self.size > 1: 
nodeToRemove = self._get(key, self.root) 
if nodeToRemove: 
self. remove(nodeToRemove ) 
self.size = self.size-1 
else: 
raise KeyError('Error, key not in tree') 
elif self.size == 1 and self.root.key == key: 
self.root = None 
self.size = self.size - 1 
else: 
raise KeyError('Error, key not in tree') 


def _ delitem_ (self, key): 
self.delete(key) 


def spliceOut(self): 
if self.isLeaf(): 
if self.isLeftChild(): 
self.parent.leftChild = None 
else: 
self.parent.rightChild = None 
elif self.hasAnyChildren(): 


if self.hasLeftChild(): 
if self.isLeftChild(): 
self.parent.leftChild = self.leftChild 
else: 
self.parent.rightChild = self.leftChild 
self.leftChild.parent = self.parent 
else: 
if self.isLeftChild(): 
self.parent.leftChild = self.rightChild 
else: 
self.parent.rightChild = self.rightChild 
self.rightChild.parent = self.parent 


def findSuccessor(self): 
succ = None 
if self.hasRightChild(): 
succ = self.rightChild.findMin() 
else: 
if self.parent: 
if self.isLeftChild(): 
succ = self.parent 
else: 
self.parent.rightChild = None 
succ = self.parent.findSuccessor() 
self.parent.rightChild = self 
return succ 


def findMin(self): 
current = self 
while current.hasLeftChild(): 
current = current.leftChild 
return current 


def remove(self, currentNode): 
if currentNode.isLeaf(): #leaf 
if currentNode == currentNode.parent.leftChild: 
currentNode.parent.leftChild = None 
else: 
currentNode.parent.rightChild = None 
elif currentNode.hasBothChildren(): #interior 
succ = currentNode.findSuccessor() 
succ.spliceOut() 
currentNode.key = succ.key 
currentNode.payload = succ.payload 


else: # this node has one child 
if currentNode.hasLeftChild(): 

if currentNode.isLeftChild(): 
currentNode.leftChild.parent = currentNode.parent 
currentNode.parent.leftChild = currentNode.leftChild 

elif currentNode.isRightChild(): 
currentNode.leftChild.parent = currentNode. parent 
currentNode.parent.rightChild = currentNode.leftChild 


else: 
currentNode.replaceNodeData(currentNode.leftChild. key, 
currentNode.leftChild. payload, 
currentNode.leftChild.leftChild, 
currentNode.leftChild.rightChild) 
else: 
if currentNode.isLeftChild(): 
currentNode.rightChild.parent = currentNode. parent 
currentNode.parent.leftChild = currentNode.rightChild 
elif currentNode.isRightChild(): 
currentNode.rightChild.parent = currentNode.parent 
currentNode.parent.rightChild = currentNode.rightChild 
else: 
currentNode.replaceNodeData(currentNode. rightChild.key, 
currentNode. rightChild. payload, 
currentNode.rightChild.leftChild, 
currentNode.rightChild. rightChild) 


mytree = BinarySearchTree() 
mytree[3]="red" 
mytree[4]="blue" 
mytree[6]="yellow" 
mytree[2]="at" 


print(mytree[6]) 
print (mytree[2]) 


查找 树 分 析 


随 着 二 又 搜索 树 的 实现 完成 ， 我 们 将 对 已 经 实现 的 方法 进行 Aoo 
方法 。 其 性 能 的 限制 因素 是 二 又 树 的 高 度 。 从 词汇 部 分 回忆 一 下 树 的 高 度 是 根 和 最 深 叶 节 
之 间 的 边 的 数量 。 高 度 是 限制 因为 当 我 们 寻找 合适 EN Rd SLAP 
我 们 需要 在 树 的 每 个 级 别 最 多 进行 一 次 比较 。 


二 又 树 的 高 度 可 能 是 多 少 ? 这 个 问题 的 答案 取决 于 如 何 将 键 添加 到 树 。 如 果 按 照 随机 顺序 添 
加 键 ， 树 的 高 度 将 在 log2^n 附近 ， 其 中 n 是 树 中 的 节点 数 。 这 是 因为 如 果 键 是 随机 分 布 的 ， 
其 中 大 约 一 半 将 小 于 根 ， 一 半 大 于 根 。 请 记 住 ， 在 二 又 树 中 ， 根 节点 有 一 个 节点 ， 下 一 级 节 
点 有 两 个 节点 ， 下 一 个 节点 有 四 个 节点 。 任 何 特 定 级 别 的 节点 数 为 2*d ， 其 中 d 是 级 别 的 深 
度 。 完 全 平衡 的 二 又 树 中 的 节点 总 数 为 2*h+1- 1， 其 中 hh 表示 树 的 高 度 。 


完全 平衡 的 树 在 左 子 树 中 具有 与 右 子 树 相 同 数量 的 节点 。 在 平衡 二 又 树 中 ， put 的 最 坏 情况 
性 能 是 O(log2^n ) ， 其 中 m 是 树 中 的 节点 数 。 注 意 ， 这 是 与 前 一 段 中 的 计算 的 反比 关系 。 所 
VAlog2*n 给 出 了 树 的 高 度 ， 并 且 表 示 了 在 适当 的 位 置 插入 新 节点 时 ， 需 要 做 的 最 大 比较 次 
数 。 


不 幸 的 是 ， 可 以 通过 以 排序 顺序 插入 键 来 构造 具有 高 度 n 的 搜索 树 ! 这 样 的 树 的 示例 见 
Figure 6。 在 这 种 情况 下 ，put 方 法 的 性 能 是 O(n)。 


现在 你 明白 了 put 方法 的 性 能 受到 树 的 高 度 的 限制 ， 你 可 能 猜测 其 他 方法 get ， in 和 
del 也 是 有 限制 的 。 由 于 get 搜索 树 以 找到 键 ， 在 最 坏 的 情况 下 ， 树 被 一 直 搜 索 到 底部 ， 
并 且 没 有 找到 键 。 乍 一 看 ， del 似乎 更 复杂 ， 因 为 它 可 能 需要 在 删除 操作 完成 之 前 搜索 后 
继 。 但 请 记 住 ， 找 到 后 继 者 的 最 坏 情况 也 只 是 树 的 高 度 ， 这 意味 着 你 只 需要 加 倍 工作 。 因为 
加 倍 是 一 个 常数 因子 ， 它 不 会 改变 最 坏 的 情况 


Figure 6 


6.14. 查 找 树 分 析 


234 


6.15. 平 衡 二 又 搜索 树 


在 上 一 节 中 ， 我 们 考虑 构建 一 个 二 又 搜索 树 。 正 如 我 们 所 学 到 的 ， 二 又 搜索 树 的 性 能 可 以 降 
级 到 O(n) 的 操作 ， 如 get 和 put ， 如 果树 变 得 不 平衡 。 在 本 节 中 ， 我 们 将 讨论 一 种 特殊 
类 型 的 二 又 搜索 树 ， 它 自动 确保 树 始终 保持 平衡 。 这 棵 树 被 称 为 AVL 树 ， 以 其 发 明 人 命名 : 
G.M. Adelson-Velskii 和 E.M.Landis。 


AVL 树 实现 Map 抽象 数据 类 型 就 像 一 个 常规 的 二 又 搜索 树 ， 唯 一 的 区 别 是 树 的 执行 方式 。 为 
了 实现 我 们 的 AVL 树 ， 我 们 需要 跟踪 树 中 每 个 节点 的 平衡 因子 。 我 们 通过 查看 每 个 节点 的 左 
右 子 树 的 高 度 来 做 到 这 一 点 。 更 正式 地 ， 我 们 将 节点 的 平衡 因子 定义 为 左 子 树 的 高 度 和 右 子 
树 的 高 度 之 间 的 差 。 


balanceFactor = height(leftSubTree) - height(rightSubTree) 


使 用 上 面 给 出 的 平衡 因子 的 定义 ， 我 们 说 如 果 平 衡 因子 大 于 零 ， 则 子 树 是 堪 重 的 。 如 果 平 衡 
因子 小 于 零 ， 则 子 树 是 右 重 的 。 如 果 平 衡 因 子 是 零 ， 那 么 树 是 完美 的 平衡 。 为 了 实现 AVL 树 ， 
并 且 获 得 具有 平衡 树 的 好 处 ， 如 果 平 衡 因 子 是 -1,0 或 1， 我 们 将 定义 树 平衡 。 一 旦 树 中 的 节 
点 的 平衡 因子 是 在 这 个 范围 之 外 ， 我 们 将 需要 一 个 程序 来 使 树 恢复 平衡 。Figure 1 展示 了 不 平 
衡 ， 右 重 树 和 每 个 节点 的 平衡 因子 的 示例 。 


Figure 1 


6.16.AVL 平 衡 二 又 搜索 树 


在 我 们 继续 之 前 ， 我 们 来 看 看 执行 这 个 新 的 平衡 因子 要 求 的 结果 。 我 们 的 主张 是 ， 通 过 确保 
树 总 是 具有 -1,0 或 1 的 平衡 因子 ， 我 们 可 以 获得 更 好 的 操作 性 能 的 关键 操作 。 让 我 们 开始 思 
考 这 种 平衡 条 件 如 何 改变 最 坏 情 况 的 树 。 有 两 种 可 能 性 ， 一 个 左 重 树 和 一 个 右 重 树 。 如果 我 
们 考虑 高 度 0,1,2 和 3 的 树 ，Figure 2 展示 了 在 新 规则 下 可 能 的 最 不 平衡 的 左 重 树 。 


Figure 2 


看 树 中 节点 的 总 数 ， 我 们 看 到 对 于 高 度 为 0 的 树 ， 有 1 个 节点 ， 对 于 高 度 为 1 的 树 ， 有 1+1=2 
个 节点 ， 对 于 高 度 为 2 的 树 是 1 + 1+ 2 = 4， 对 于 高 度 为 3 的 树 ， 有 1+2+4=7。 更 一 般 
地 ， 我 们 看 到 的 高 度 h(Nh) 的 树 中 的 节点 数量 的 模式 是 : 


N; = 1 + Np} + Np-2 


这 种 可 能 看 起 来 很 熟悉 ， N 类 似 于 辈 波 纳 契 序列 。 给 定 树 中 节点 oa ， 我 们 可 以 
使 用 这 个 事实 来 导出 AVL 树 的 高 度 的 公式 。 回想 一 下 ， 对 于 裴 波 纳 契 数列 ， 第 i 个 斐 波 纳 契 数 
字 由 下 式 给 出 
Fy = 0 
F, =! 
F; = Fi- + Fi-2 for all i > 2 


一 个 重要 的 数学 结果 是 ， 随 着 斐 波 纳 契 数列 越 来 越 大 ，Fi/Fi-1 的 比率 越 来 越 接近 黄金 比率 = 
(1 +V5)/2 ° ee ， 可 以 查阅 数学 文本 。 我 们 将 简单 地 使 用 该 方程 
来 近似 Fir to Fi = 中 Ai15。 如 果 我 们 利用 这 个 近似 ， 我 们 可 以 重 写 Nh 的 方程 为 : 


An = Fh+2 pe l, h = 1 


通过 用 其 黄金 比例 近似 替换 辈 波 那 契 参考 ， 我 们 得 到 : 


h+2 
Nn = = -1 
V5 





如 果 我 们 重新 排列 这 些 项 ， 并 取 两 边 的 底数 为 2 的 对 数 ， 然 后 求解 h， 我 们 得 到 以 下 推导 : 
log N, + 1 = (H + 2) log ® — jlog5 
log Na +1 一 2log 中 十 Slog 5 
7 log 中 
h = 1.44 log Np, 
这 个 推导 告诉 我 们 ， 在 任何 时 候 ， 我 们 的 AVL 树 的 高 度 等 于 树 中 节点 数目 的 对 数 的 常数 
(1.44) 倍 。 这 是 搜索 我 们 的 AVL 树 的 好 消息 ， 因 为 它 将 搜索 限制 为 O(logN) © 


6.17.AVL 平衡 二 又 搜索 树 实 现 


现在 我 们 已 经 证 明 保 持 AVL 树 的 平衡 将 是 一 个 很 大 的 性 能 改进 ， 让 我 们 看 看 如 何 增加 过 程 来 
插入 一 个 新 的 键 到 树 。 由 于 所 有 新 的 键 作为 叶 节 点 插入 到 树 中 ， 并 且 我 们 知道 新 叶 的 平衡 因 
子 为 零 ， 所 以 刚刚 插入 的 节点 没有 新 的 要 求 。 但 一 旦 添加 新 叶 ， 我 们 必须 更 新 其 父 的 平衡 因 
子 。 这 个 新 叶 如 何 影 响 父 的 平衡 因子 取决 于 叶 节 点 是 左 孩 子 还 是 右 骇 子 。 如 果 新 节点 是 右 子 
节点 ， 则 父 节 点 的 平衡 因子 将 减少 1。 如 果 新 节点 是 左 子 节点 ， 则 父 节 点 的 平衡 因子 将 增加 
1。 这 个 关系 可 以 递归 地 应 用 到 新 节点 的 祖父 节点 ， 并 且 应 用 到 每 个 祖先 一 直到 树 的 根 。 由 于 
这 是 一 个 递归 过 程 ， 我 们 来 看 一 下 用 于 更 新 平衡 因子 的 两 种 基本 情况 : 


o 递归 调用 已 到 达 树 的 根 。 
e 父 节 点 的 平衡 因子 已 调整 为 零 。 你 应 该 说 服 自 己 ， 一 旦 一 个 子 树 的 平衡 因子 为 零 ， 那 么 
它 的 祖先 节点 的 平衡 不 会 改变 。 


我 们 将 实现 AVL 树 作 为 BinarysearchTree FX HA?’ RIBAS put 方法 并 编写 一 
个 新 的 updateBalance 辅助 方法 。 这 些 方法 如 Listing 1 所 示 。 你 将 注意 到 ， put 的 定义 与 
简单 二 又 搜索 树 中 的 完全 相同 ， 除 了 第 7 行 和 第 13 行 上 对 updateBalance 的 调用 的 添加 。 


def _put(self, key, val, currentNode): 
if key < currentNode.key: 
if currentNode.hasLeftChild(): 
self._put(key, val, currentNode. leftChild) 
else: 
currentNode.leftChild = TreeNode(key, val, parent=currentNode) 
self .updateBalance(currentNode. leftChild) 
else: 
if currentNode.hasRightChild(): 
self._put(key, val, currentNode. rightChild) 
else: 
currentNode.rightChild = TreeNode(key, val, parent=currentNode ) 
self .updateBalance(currentNode. rightChild) 


def updateBalance(self,node): 
if node.balanceFactor > 1 or node.balanceFactor < -1: 
self .rebalance(node) 
return 
if node.parent != None: 
if node.isLeftChild(): 
node.parent.balanceFactor += 1 
elif node.isRightChild(): 
node.parent.balanceFactor -= 1 


if node.parent.balanceFactor != 0: 
self .updateBalance(node.parent) 


Listing 1 


新 的 updateBalance 方法 完成 了 大 多 数 工 作 。 这 实现 了 我 们 刚才 描述 的 递归 过 程 。 
updateBalance 方法 首先 检查 当前 节 点 是 否 不 够 平衡 ， 需要 重新 平衡 (第 16 行 ) 。 如 果 平 
衡 ， 则 重新 平衡 完成 ， 并 且 不 需要 对 父 节点 进行 进一步 更 新 。 ee eas 
衡 ， 则 调整 父 节 点 的 平衡 因子 。 如 果 父 的 平衡 因子 不 为 零 ， 那 么 工法 通过 递归 调用 父 对 象 上 
的 updateBalance ， 继续 沿 树 向 根 向 上 运行 。 


需要 树 重 新 平衡 时 ， 我 们 如 何 做 呢 ? 有 效 的 重新 平衡 是 使 AVL 树 在 不 牺牲 性 能 的 情况 下 正常 
= 的 关键 。 为 了 使 AVL 树 恢复 平衡 ， 我 们 将 在 树 上 执行 一 个 或 多 个 旋转 。 


要 理解 旋转 是 什么 让 我 们 看 一 个 非常 简单 的 例子 。 考 虑 Figure 3 左 半 部 分 的 树 。 这 棵 树 平衡 
因子 为 -2， 不 平衡 。 为 了 使 这 棵 树 平 衡 ， 我 们 将 使 用 以 节点 A 为 根 的 子 树 的 左旋 转 。 


Figure 3 
要 执行 左旋 转 ， 我 们 基本 上 执行 以 下 操作 : 


© RIET (B) 成 为 子 树 的 根 。 

e 将 昌 根 (A) 移动 为 新 根 的 左 子 节点 

e 如 果 新 根 (B) 已 经 有 一 个 左 孩 子 ， 那 么 使 它 成 为 新 左 孩 子 (A) 的 右 孩 子 。 注 意 : 由 于 
新 根 (B) 是 A 的 右 孩 子 ，A 的 右 孩 子 在 这 一 点 上 保证 为 室 。 这 允许 我 们 添加 一 个 新 的 节 
点 作为 右 孩 子 ， 不 需 进一步 的 考虑 。 


虽然 这 个 过 程 在 概念 上 相当 容易 ， 但 是 代码 的 细节 有 点 棘手 ， 因 为 我 们 需要 按照 正确 的 顺序 
移动 事物 ， 以 便 保 留 二 又 搜索 树 的 所 有 属性 。 此 外 ， 我 们 需要 确保 适当 地 更 新 所 有 的 父 指 
针 。 


让 我 们 看 一 个 稍微 更 复杂 的 树 来 说 明 右 旋转 。Figure 4 的 左 侧 显示 了 树 的 左 重 ， 在 根 处 的 平衡 
因子 为 2。 要 执行 右 旋 转 ， 我 们 基本 上 执行 以 下 操作 : 


。 提升 左 子 节点 (C) 为 子 树 的 根 。 
。 HER (E) 移动 为 新 根 的 右 子 树 。 
。 如 果 新 根 (C) 已 经 有 一 个 正确 的 孩子 (D) ， 那 么 使 它 成 为 新 的 右 孩 子 (E) HAR 


子 。 注 意 : 由 于 新 根 (C) 是 E 的 左 子 节点 ， 因 此 E 的 左 子 节点 在 此 时 保证 为 空 。 这 多 
许 我 们 添加 一 个 新 节点 作为 左 孩 子 ， 不 需 进 一 步 的 考虑 。 
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Figure 4 


现在 你 已 经 看 到 了 旋转 ， 并 且 有 旋转 的 工作 原理 的 基本 概念 ， 让 我 们 看 看 代码 。Listing 2 展示 
了 右 旋转 和 左旋 转 的 代码 。 在 第 2 行 中 ， 我 们 创建 一 个 临时 变量 来 跟踪 子 树 的 新 根 。 正 如 我 们 
之 前 所 说 的 ， 新 的 根 是 上 一 个 根 的 右 孩 子 。 现 在 对 这 个 临时 变量 存储 了 一 个 对 右 孩 子 的 引 

用 ， 我 们 用 新 的 左 孩 子 替换 日 根 的 右 孩 子 。 


下 一 步 是 调整 两 个 节点 的 父 指 针 。 如 果 newRoot 有 一 个 堪 子 节点 ， 那 么 左 子 节点 的 新 父 节点 
变 成 昌 的 根 节点 。 新 根 的 父 节 点 设置 为 昌 根 的 父 节点 。 如 果 昌 根 是 整个 树 的 根 ， 那 么 我 们 必 
须 设置 树 的 根 以 指向 这 个 新 根 。 否 则 ， 如 果 昌 根 是 左 孩 子 ， 则 我 们 将 左 孩 子 的 父 节 点 更 改 为 
指向 新 根 ;否则 我 们 改变 右 孩 子 的 父亲 指向 新 的 根 。 ( 行 10-13) 。 最 后 ， 我 们 将 旧 根 的 父 节点 
设置 为 新 根 。 这 是 一 个 很 复杂 的 过 程 ， 所 以 我 们 鼓励 你 跟踪 这 个 功能 ， 同 时 看 下 Figure 3。 
rotateRight 方法 是 对 称 的 rotateLeft ， 所 以 我 们 将 留 给 你 来 研究 rotateRight 的 代码 。 


def rotateLeft(self,rotRoot): 

newRoot = rotRoot.rightChild 
rotRoot.rightChild = newRoot.leftChild 
if newRoot.leftChild != None: 

newRoot.leftChild.parent = rotRoot 
newRoot.parent = rotRoot.parent 
if rotRoot.isRoot(): 

self.root = newRoot 
else: 

if rotRoot.isLeftChild(): 

rotRoot.parent.leftChild = newRoot 
else: 
rotRoot.parent.rightChild = newRoot 

newRoot.leftChild = rotRoot 
rotRoot.parent = newRoot 
rotRoot.balanceFactor = rotRoot.balanceFactor + 1 - min(newRoot.balanceFactor, 0) 
newRoot.balanceFactor = newRoot.balanceFactor + 1 + max(rotRoot.balanceFactor, 0) 


Listing 2 


最 后 ， 第 16-17 行 需要 一 些 解 释 。 在 这 两 行 中 ， 我 们 更 新 昌 根 和 新 根 的 平衡 因子 。 由 于 所 有 
其 他 移动 都 是 移动 整个 子 树 ， 所 以 所 有 其 他 节点 的 平衡 因子 不 受 旋转 的 影响 。 但 是 我 们 如 何 
在 不 完全 重新 计算 新 子 树 的 高 度 的 情况 下 更 新 平衡 因子 呢 ? 以 下 推导 应 该 能 说 服 你 这 些 行 是 
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Figure 5 


Figure 5 展示 了 左旋 转 。B 和 D 是 关键 节点 ，A，C，E 是 它们 的 子 树 。 设 hx 表示 以 节点 X 
为 根 的 特定 子 树 的 高 度 。 根据 定义 ， 我 们 知道 以 下 : 


newBal(B)=hA-hC oldBal(B)=hA-hD 


但 我 们 知道 ，D 的 加 高度 也 可 以 由 1+ max(hco he) 给 出 ， 也 就 是 说 ，D 的 高 度 比 其 两 个 孩子 
的 最 大 高 度 大 1。 记 住 ，hc 和 hE 没有 改变 。 所 以 ， 让 我 们 用 第 二 个 方程 来 代替 它 


oldBal(B)=hA-(1+max(hC,hE)) 


然后 减 去 这 两 个 方程 。 以 下 步骤 进行 减法 并 使 用 一 些 代数 来 简化 newBal(B) 的 等 式 。 


newBal(B)-oldBal(B)=hA-hC-(hA-(1+max(hC,hE))) newBal(B)-oldBal(B)=hA-hC-hA+ 
(1+max(hC,hE)) newBal(B)-oldBal(B)=hA-hA+1+max(hC,hE)-hC newBal(B) 
-oldBal(B)=1+max(hC,hE)-hC 


接 下 来 我 们 将 oldBal(B) 移动 到 方程 的 右边 ， 并 利用 max(a,b) -c = max(a-c’b-c) ° 
newBal(B)=oldBal(B)+1+max(hC-hC,hE-hC) 


但 是 ，hE-hC 5 -oldBal(D) 相同 。 因 此 ， 我 们 可 以 使 用 另 一 个 表示 max(-a > -b) = -min(a，b) 
的 标识 。 因此， 我 们 可 以 完成 我 们 的 newBal(B) 的 推导 ， 具 有 以 下 步骤 : 


newBal(B)=oldBal(B)+1+max(0,-oldBal(D)) newBal(B)=oldBal(B)+1-min(0,oldBal(D)) 


现在 我 们 有 所 有 的 部 分 9 我 们 很 容易 知道 o 我 们 记 住 B 是 rotRoot 和 D 是 newRoot 然后 我 们 
可 以 看 到 这 正好 对 应 第 16 行 的 语句 ， 或 者 : 


rotRoot.balanceFactor = rotRoot.balanceFactor + 1 - min(0,newRoot.balanceFactor) 


类 似 的 推导 给 出 了 更 新 的 节点 D 的 方程 ， 以 及 右 旋转 后 的 平衡 因子 。 我们 把 这 些 作 为 你 的 练 
习 o 


现在 你 可 能 认为 我 们 已 经 完成 了 。 我 们 知道 如 何 做 左右 旋转 ， 我 们 知道 什么 时 候 应 该 做 左旋 
或 右 旋 ， 但 是 看 看 Figure 6。 由 于 节点 A 的 平衡 因子 为 -2， 我 们 应 该 做 左旋 转 。 但 是 ， 当 我 
们 围绕 A 做 左旋 转 时 会 发 生 什么 ? 


Figure 6 


Piao Ca tee 旋 后 ， 我 们 现在 已 经 在 另 一 方面 失去 平衡 。 如 果 我 们 做 右 旋 以 纠正 
这 种 情况 ， 我 们 就 回 到 我 们 开始 的 地 方 。 


Figure 7 
要 纠正 这 个 问题 ， 我 们 必须 使 用 以 下 规则 集 : 


。 如 果子 树 需要 左旋 转 使 其 平衡 ， 首 先 检查 右 子 节点 的 平衡 因子 。 如果 右 孩子 是 重 的 ， 那 
么 对 右 孩 子 做 右 旋 转 ， 然 后 是 原来 的 左旋 转 。 

。 如 果子 树 需要 右 旋转 使 其 平衡 ， 首 先 检查 左 子 节点 的 平衡 因子 。 如 果 左 孩子 是 重 的 ， 那 
么 对 左 孩 子 做 左旋 转 ， 然 后 是 原来 的 右 旋转 。 


Figure 8 展示 了 这 些 规 则 如 何 解决 我 们 在 Figure 6 和 Figure 7 中 遇 到 的 困境 。 从 围绕 节点 C 的 
右 旋转 开始 ， 将 树 放 置 在 人 的 左旋 转 使 整个 子 树 恢复 平衡 的 位 置 。 
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Figure 8 
实现 这 些 规则 的 代码 可 以 在 我 们 的 重新 平衡 方法 中 找到 ， 如 Listing 3 所 示 。 上 面 的 规则 编 
是 从 第 2 行 的 if 语 名 实现 的 。 规 则 编号 2 是 由 第 8 行 开始 的 elif 语 名 实现 的 o 


号 1 


def rebalance(self, node): 
if node.balanceFactor < 0: 
if node.rightChild.balanceFactor > 0: 
self.rotateRight (node. rightChild) 
self.rotateLeft(node) 
else: 
self.rotateLeft(node) 
elif node.balanceFactor > 0: 
if node.leftChild.balanceFactor < 0: 
self.rotateLeft(node.leftChild) 
self.rotateRight (node) 
else: 
self.rotateRight (node) 


Listing 3 


通过 保持 树 在 所 有 时 间 的 平衡 ， 我 们 可 以 确保 get 方法 将 按 O(log2(n)) 时 间 运 行 。 但 问题 是 
我 们 的 put 方法 有 什么 成 本 ? 让 我 们 将 它 分 解 为 put 执行 的 操作 。 由 于 将 新 节点 作为 叶子 插 
入 ， 更 新 所 有 父 节点 的 平衡 因子 将 需要 最 多 log2^n 运算 ， 树 的 每 层 一 个 运算 。 如 果 发 现 子 树 
不 平衡 ， 则 需要 最 多 两 次 旋转 才能 使 树 重新 平衡 。 但 是 ， 每 个 旋转 在 O(1) 时 间 中 工作 ， 因 此 
我 们 的 put 操 作 仍然 是 DO (log2^n )。 


在 这 一 点 上 ， 我 们 已 经 实现 了 一 个 功能 AVL 树 ， 除 非 你 需要 删除 一 个 节点 的 能 力 。 我 们 保留 删 
除 节点 和 随后 的 更 新 和 重新 平衡 作为 一 个 练习 。 


6.18.Map 抽 象 数据 结构 总 结 


在 前 面 两 章 中 ， 我 们 已 经 研究 了 可 以 用 于 实现 Map 抽象 数据 类 型 的 几 个 数据 结构 。 二 又 搜索 
表 ， 散 列表 ， 二 又 搜索 树 和 平衡 二 又 搜索 树 。 总结 这 一 节 ， 让 我 们 总 结 Map ADT 定义 的 关 
键 操 作 的 每 个 数据 结构 的 性 能 (Table 1) 。 


operation Sorted List Hash Table Binary Search Tree AVL Tree 
put O(n) O(1) O(n) O(log, n) 
get O(log, n) O(1) O(n) O(log, n) 
in O(log, n) O(1) O(n) O(log, n) 


del O(n) O(1) O(n) O(log, n) 


6.19. $% 2% 


在 这 一 章 中 ， 我 们 看 了 树 的 数据 结构 。 树 数据 结构 使 我 们 能 够 编写 许多 有 趣 的 算法 。 在 本 章 
中 ， 我 们 研究 了 使 用 树 来 执行 以 下 操作 的 算法 : 


e 用 于 解析 和 计算 表达 式 的 二 又 树 。 

。 用 于 实现 Map ADT 的 二 又 树 。 

。 用 于 实现 Map ADT 的 平衡 二 又 树 (AVL 树 ) 。 
© 一 个 二 又 树 实现 一 个 最 小 堆 。 

© 用 于 实现 优先 级 队列 的 最 小 堆 。 


7. 图 和 图 的 工法 
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7.1. 目 标 


© 了解 图 是 什么 ， 以 及 如 何 使 用 它 。 
© 使 用 多 个 内 部 表示 来 实现 图 抽象 数据 类 型 。 
。 看 看 如 何 使 用 图 来 解决 各 种 各 样 的 问题 


在 本 章 中 ， 我 们 将 研 究 图 。 图 是 比 我 们 在 上 一 章 中 研究 的 树 更 通用 的 结构 ;实际 上 你 可 以 认为 
树 是 一 种 特殊 的 图 。 图 可 以 用 来 表示 我 们 世界 上 许多 有 趣 的 事情 ， 包 括 道路 系统 ， 从 城市 到 
城市 的 航空 公司 航班 ， 互 联网 如 何 连 接 ， 甚 至 是 完成 计算 机 科学 专业 必须 完成 的 课程 顺序 。 
我 们 将 在 本 章 中 看 到 ， 一 旦 我 们 有 一 个 问题 的 好 的 表示 ， 我 们 可 以 使 用 一 些 标准 图 算法 来 解 
决 ， 否 则 可 能 是 一 个 非常 困难 的 问题 。 


虽然 人 们 相对 容易 看 路 线 图 并 且 理 解 不 同 地 点 之 间 的 关系 ， 但 计算 机 没有 这 样 的 知识 。 然 
而 ， 我 们 也 可 以 将 路 线 图 视 为 图 。 当 我 们 这 样 做 时 ， 我 们 可 以 让 我 们 的 计算 机 为 我 们 做 有 趣 
的 事情 。 如 果 你 曾经 使 用 过 一 个 互联 网 地 图 网 站 ， 你 知道 一 台 计 算 机 可 以 找到 从 一 个 地 方 到 
另 一 个 地 方 最 短 ， 最 快 或 最 简单 的 路 径 。 


作为 计算 机 科学 的 学 生 ， 你 可 能 想 知道 你 必须 学 习 的 课程 ， 以 获得 一 个 学 位 。 图 是 表示 学 该 
课程 之 前 的 先决 条 件 和 其 他 相互 依存 关系 的 好 方法 。Figure 1 展示 了 另 一 个 图 。 这 个 代表 了 
在 路 德 学 院 完 成 计算 机 科学 专业 的 课程 和 顺序 。 


7.2. 词 汇 和 定义 


现在 我 们 已 经 看 了 一 些 图 的 示例 ， 我 们 将 更 正式 地 定义 图 及 其 组 件 。 我 们 已 经 从 对 树 的 讨论 
中 知道 了 一 些 术 语 。 


ABE (GGA PR) ARNE SHA ROA TAR RNR RAR 
能 有 额 外 的 信 ， 0 我 们 将 这 个 附加 信息 息 称 为 “有 效 载荷 " 5 


边 边 RAM) 是 图 的 另 一 个 基本 部 分 。 边 连接 两 个 顶点 ， 以 表明 它们 之 间 存 在 关系 。 
边 可 以 是 单 向 的 或 双向 的 。 如 果 图 中 的 边 都 是 单 向 的 ， 我 们 称 该 图 是 有 向 图 。 上 面 显示 的 课 
程 先 决 条 件 显 然 是 一 个 图 ， 因 为 你 必须 在 其 他 课程 之 前 学 习 一 些 课程 。 


权重 边 可 以 被 加 权 以 示 出 从 一 个 顶点 到 另 一 个 顶点 的 成 本 。 例 如 ， 在 将 一 个 城市 连接 到 另 一 
个 城市 的 道路 的 图 表 中 ， 边 上 的 权重 可 以 表示 两 个 城市 之 间 的 距离 。 


利用 这 些 定 义 ， 我 们 可 以 正式 定义 图 。 图 可 以 由 G 表示 ， 其 中 Gave) 。 对 于 图 G，V 是 


一 组 顶点 ，E 是 一 组 边 。 每 个 边 是 一 个 元 组 (Vow ， 其 中 wvev。 我 们 可 以 添加 第 三 个 
组 件 到 边 元 组 来 表示 权重 。 子 图 s 是 边 @ 和 顶点 Vv 的 集合 ， 使 得 ec 和 vev 。 


Figure 2 展示 了 简单 加 权 有 向 图 的 另 一 示例 。 正 式 地 ， 我 们 可 以 将 该 图 表示 为 六 个 顶点 的 集 
人 

V={V0,V1,V2,V3,V4,V5} 

和 9 条 边 的 集合 


E={(v0,v1,5),(v1,v2,4),(v2,v3,9),(v3,v4,7),(v4,v0,1),(v0,v5,2),(v5,v4,8),(v3,v5,3),(v5,v2,1)} 





Figure 2 
figure 2 中 的 示例 图 有 助 于 说 明 两 个 其 他 关键 图 形 术 语 : 


路 径 图 中 的 路 径 是 由 边 连 接 的 顶点 序列 。 形 式 上 ， 我 们 将 定义 一 个 路 径 为 ww.. own ， 
使 得 (wiowi +1) EE, 4 asis n-1 。 未 加 权 路 径 长 度 是 路 径 中 的 边 的 数目 ， 具 体 是 n-a 

o 加权 路 径 长 度 是 路 径 中 所 有 边 的 权重 的 总 和 。 例 如 在 Figure 2 中 ， 从 V3 到 V1 的 路 径 是 顶 
点 序列 (V3 v4: vo: v1) 。 边 是 { (v3°Vv4,7) ，(v4,vg,1) > (v@>v1,5)} } ° 


循环 有 向 图 中 的 循环 是 在 同一 顶 点 开始 和 结束 的 路 径 o 例如 ’ 在 Figure 2 中 9 路 径 (V5，V2 ， 


V3°V5) 是 一 个 循环 。 没 有 循环 的 图 形 称 为 非 循环 图 形 。 没 有 循环 的 有 向 图 称 为 有 向 无 环 图 或 
DAG ° 我 们 将 看 到 ? 如 果 问 题 可 以 表示 为 DAG ， 我 们 可 以 解决 几 个 重要 的 问题 ò 
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图 抽象 数据 类 型 (ADT) 定义 如 下 : 


Graph() 创建 一 个 新 的 空 图 。 

addVertex(vert) 向 图 中 添加 一 个 顶点 实例 。 

addEdge(fromVert, toVert) 向 连接 两 个 顶点 的 图 添加 一 个 新 的 有 向 边 。 
addEdge(fromVert, toVert, weight) 向 连接 两 个 顶点 的 图 添加 一 个 新 的 加 权 的 有 向 边 。 
getVertex(vertKey) 在 图 中 找到 名 为 vertkey 的 顶点 。 

getVertices() 返回 图 中 所 有 顶点 的 列表 。 

in 返回 True 如 果 vertex in graph 里 给 定 的 顶点 在 图 中 ， 否 则 返回 False。 


从 图 的 正式 定义 开始 ， 我 们 有 几 种 方法 可 以 在 Python 中 实现 图 ADT。 我 们 将 看 到 在 使 用 不 
同 的 表示 来 实现 上 述 ADT 时 存在 权衡 。 有 两 个 众所周知 的 图 形 、 实 现 ， 和 邻接 矩阵 和 BHA 
。 我们 将 解释 这 两 个 选项 ， 然 后 实现 一 个 作为 Python 类 。 


7.4. 邻 接 和 矩阵 


实现 图 的 最 简单 的 方法 之 一 是 使 用 二 维和 矩阵 。 在 该 矩阵 实现 中 ， 每 个 行 和 列表 示 图 中 的 顶 
点 。 存 储 在 行 v 和 列 W 的 交叉 点 处 的 单元 中 的 值 表示 是 否 存在 从 顶点 V 到 顶点 w 的 边 。 当 
两 个 顶点 通过 边 连接 时 ， 我 们 说 它们 是 相 邻 的 。 Figure 3 展示 了 Figure 2 中 的 图 的 邻接 矩 
阵 。 单 元 格 中 的 值 表示 从 顶点 V 到 顶点 W 的 边 的 权重 。 





Figure 3 


邻接 矩阵 的 优点 是 简单 ， 对 于 小 图 ， 很 容易 看 到 哪些 节点 连接 到 其 他 节点 。 Rin ERM 
中 的 大 多 数 单元 格 是 空 的 。 因为 大 多 数 单元 格 是 空 的 ， 我 们 说 这 个 矩阵 是 “ 黎 芍 的 "。 纸 阵 不 
是 一 种 非常 有 效 的 方式 来 存储 稀 朴 数据 。 事实 上 ， 在 Python 中 ， 你 甚至 要 创建 一 个 如 Figure 
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当 边 的 数量 大 时 ， 邻 接 和 矩阵 是 图 的 良好 实现 。 但 是 什么 是 大 ? 填充 矩阵 需要 多 少 边 ? 由 于 图 
中 每 个 顶点 有 一 行 和 一 列 ， 填 充 矩 阵 所 需 的 边 数 为 |V|^2。 当 每 个 顶点 连接 到 每 个 其 他 顶点 
时 ， 和 矩阵 是 满 的 。 有 几 个 丨 实 的 问题 ， 接 近 这 种 连接 。 我们 在 本 章 中 讨论 的 问题 都 涉及 稀 玻 
连接 的 图 。 


7.5. 邻 接 表 


7.5. 邻 接 表 


实现 稀 跌 连接 图 的 更 空间 高 效 的 方法 是 使 用 邻接 表 。 在 邻接 表 实 现 中 ， 我 们 保存 Graph 对 象 
中 的 所 有 顶点 的 主 列表 ， 然 后 图 中 的 每 个 顶点 对 象 维 护 连接 到 的 其 他 顶点 的 列表 。 在 我 们 的 
顶点 类 的 实现 中 ， 我 们 将 使 用 字典 而 不 是 列表 ， 其 中 字典 键 是 顶点 ， 值 是 权重 。 Figure 4 展 
示 了 Figure 2 中 的 图 的 邻接 列表 示 。 








id = "VO" 
adj = { V1:5, V5:2 } 







id = "V1" 
adj = { V2:4 } 







id = "V2" 
adj = { V3:9 } 
Vertex Objects 
id = "V5" 

adj = { V4:7, V5:3 } 







id 一 "y4" 
adj = { VO:1 } 


ss 
I I I a 





numVertices =6 


Figure 4 


邻接 表 实 现 的 优点 是 它 允 许 我 们 紧凑 地 表示 稀疏 图 。 邻接 表 还 允许 我 们 容易 找到 直接 连接 到 
特定 顶点 的 所 有 链接 。 
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7.6. 实 现 


使 用 字典 ， 很 容易 在 Python 中 实现 邻接 表 。 在 我 们 的 Graph 抽象 数据 类 型 的 实现 中 ， 我 们 
将 创建 两 个 类 (I Listing 1 和 Listing2) > Graph (保存 顶点 的 主 列表 ) 和 Vertex (将 表示 图 
中 的 每 个 顶点 ) 。 


每 个 顶点 使 用 字典 来 跟踪 它 连接 的 顶点 和 每 个 边 的 权重 。 这 个 字典 称 为 connectedTo 。 Fa 
的 列表 展示 了 vertex 类 的 代码 。 构 造 函 数 只 是 初始 化 id ， 通 常 是 一 个 字符 串 和 
connectedTo 字典 ° addNeighbor 方法 用 于 从 这 个 顶点 添加 一 个 连接 到 另 一 

个 。 getConnections 方法 返回 邻接 表 中 的 所 有 顶点 ， 如 connectedTo 实例 变量 所 示 。 
getweight 方法 返回 从 这 个 顶点 到 作为 参数 传递 的 顶点 的 边 的 权重 。 


class Vertex: 
def __init__(self,key): 
self.id = key 
self.connectedTo = {} 


def addNeighbor(self,nbr,weight=0): 
self.connectedTo[nbr] = weight 


def str (self): 


return str(self.id) + ' connectedTo: ' + str([x.id for x in self.connectedTo]) 


def getConnections(self): 
return self.connectedTo.keys() 


def getId(self): 
return self.id 


def getWeight(self,nbr): 
return self.connectedTo[nbr] 


Listing 1 


下 一 个 列表 中 显示 的 Graph 类 包含 将 顶点 名 称 映 射 到 顶点 对 象 的 字典 。 在 Figure 4 中 ， 该 字 
典 对 象 由 阴影 灰色 框 表 示 。 Graph 还 提供 了 将 顶点 添加 到 图 并 将 一 个 顶点 连接 到 另 一 个 顶点 
的 方法 。 getvertices 方法 返回 图 中 所 有 顶点 的 名 称 。 此 外 ， 我 们 实现 了 _iter Aik? 
以 便 轻 松 地 遍历 特定 图 中 的 所 有 顶点 对 象 。 这 两 种 方法 允许 通过 名 称 或 对 象 本 身 在 图 形 中 的 
顶点 上 进行 迭代 。 


class Graph: 
def _ init__(self): 
self.vertList = {} 
self.numVertices = 0 


def addVertex(self, key): 
self.numVertices = self.numVertices + 1 
newVertex = Vertex(key) 
self.vertList[key] = newVertex 
return newVertex 


def getVertex(self,n): 
if n in self.vertList: 
return self.vertList[n] 
else: 
return None 


def __contains__(self,n): 
return n in self.vertList 


def addEdge(self,f,t,cost=0): 
if f not in self.vertList: 
nv = self.addVertex(f) 
if t not in self.vertList: 
nv = self.addVertex(t) 
self.vertList[f].addNeighbor(self.vertList[t], cost) 


def getVertices(self): 
return self.vertList.keys() 


def _iter_ (self): 
return iter(self.vertList.values()) 


Listing 2 


使 用 刚才 定义 的 Graph 和 vertex 类 ， 下 面 的 Python 会 话 创建 Figure 2 中 的 图 。 首 先 我 们 
创建 6 个 编号 为 0 到 5 的 顶点 。 然 后 我 们 展示 顶点 字典 。 注意 ， 对 于 每 个 键 0 到 5， 我 们 创 
建 了 一 个 顶点 的 实例 。 接 下 来 ， 我 们 添加 将 顶点 连接 在 一 起 的 边 。 最 后 ， 嵌 套 循 环 验证 图 中 
的 每 个 边缘 是 否 正确 存储 。 你 应 该 在 本 会 话 结束 时 根据 Figure 2 检查 边 列 表 的 输出 是 否 正 
确 。 


>>> g = Graph() 
>>> for i in range(6): 
g.addVertex(i) 
>>> g.vertList 
{0: <adjGraph.Vertex instance at 0x41e18>, 


1: <adjGraph.Vertex instance at Ox7f2b0>, 
2: <adjGraph.Vertex instance at 0x7f288>, 
3: <adjGraph.Vertex instance at 0x7f350>, 
4: <adjGraph.Vertex instance at 0x7f328>, 
5: <adjGraph.Vertex instance at 0x7f300>} 

>>> g.addEdge(0,1,5) 

>>> g.addEdge(0,5, 2) 

>>> g.addEdge(1, 2,4) 

>>> g.addEdge(2,3,9) 

>>> g.addEdge(3, 4,7) 

>>> g.addEdge(3,5,3) 

>>> g.addEdge(4,0,1) 

>>> g.addEdge(5, 4,8) 

>>> g.addEdge(5,2,1) 


>>> for v in g: 
for w in v.getConnections(): 
print("( %s , %s )" % (v.getId(), w.getId())) 
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Figure 2 


7.7. 字 梯 的 问题 


让 我 们 从 下 面 的 叫 字 梯 的 难题 开始 图 算法 研究 。 将 单词 “FOOL” 转换 为 单词 “SAGE”。 在 字 
梯 中 你 通过 改变 一 个 字母 逐渐 发 生变 化 。 在 每 一 步 ， 你 必须 将 一 个 字 变换 成 另 一 个 字 。 字 梯 
益 智 游戏 是 刘易斯 卡 罗 尔 1878 年 发 明 的 ， 爱 丽 丝 梦游 仙境 的 作者 。 下 面 的 单词 序列 示 出 了 对 
上 述 问题 的 一 种 可 能 的 解决 方案 。 


FOOL 
POOL 
POLL 
POLE 
PALE 
SALE 
SAGE 


有 许多 关于 字 梯 问题 的 变种 。 例 如 ， 可 能 附加 了 完成 转换 的 特定 数量 的 步骤 ， 或 者 可 能 需要 
使 用 特定 的 词 。 在 本 节 中 ， 我 们 将 计算 起 始 字 转换 为 结束 字 所 需 的 最 小 转换 次 数 。 


毫 不 奇怪 ， 因 为 这 一 章 是 图 ， 我 们 可 以 使 用 图 算法 解决 这 个 问题 。 这 里 是 我 们 需要 的 步骤 : 


。 将 字 之 间 的 关系 表示 为 图 。 
。 使 用 称 为 广度 优先 搜索 的 图 算法 来 找到 从 起 始 字 到 结束 字 的 有 效 路 径 。 


7.8. 构 建 字 梯 图 


我 们 的 第 一 个 问题 是 弄 清楚 如 何 将 大 量 的 单词 集合 转换 为 图 。 如 果 两 个 词 只 有 一 个 字母 不 

同 ， 我 们 就 创建 从 一 个 词 到 另 一 个 词 的 边 。 如 果 我 们 可 以 创建 这 样 的 图 ， 则 从 一 个 词 到 另 一 
个 词 的 任意 路 径 就 是 词 梯子 拼图 的 解决 方案 。 Figure 1 展示 了 一 些 解决 roo. 到 sase 字 梯 
问题 的 单词 的 小 图 。 请 注意 ， 图 是 无 向 图 ， 边 未 加 权 。 


Figure 1 


我 们 可 以 使 用 几 种 不 同 的 方法 来 创建 解决 这 个 问题 的 图 。 假 设 我 们 有 一 个 长 度 相 同 的 单词 列 
表 。 作 为 起 点 ， 我 们 可 以 在 图 中 为 列表 中 的 每 个 单词 创建 一 个 顶点 。 为 了 弄 清楚 如 何 连 接 单 
词 ， 我 们 可 以 比较 列表 中 的 每 个 单词 。 比 较 时 我 们 看 有 多 少 字母 是 不 同 的 。 如 果 所 讨论 的 两 
个 字 只 有 一 个 字母 不 同 ， 我 们 可 以 在 图 中 创建 它们 之 间 的 边 。 对 于 小 的 列表 ， 这 种 方法 会 正 
常 工作 ;然而 假设 我 们 有 一 个 5,110 词 的 列表 。 粗 略 地 说 ， 将 一 个 字 与 列表 上 的 每 个 其 他 词 
进行 比较 是 O(n^2 )。 对 于 5110 个 词 ，nA^2 是 超过 2600 万 的 比较 。 


我 们 可 以 通过 以 下 方法 做 得 更 好 。 假 设 我 们 有 大 量 的 桶 ， 每 个 桶 在 外 面 有 一 个 四 个 字母 的 单 
词 ， 除 了 标签 中 的 一 个 字母 已 经 被 下 划 线 替代 。 例 如 ， 看 Figure 2， 我 们 可 能 有 一 个 标记 为 
“pop” 的 桶 。 当 我 们 处 理 列表 中 的 每 个 单词 时 ， 我 们 使 用 © 作为 通配符 比较 每 个 桶 的 单词 ， 所 
以 “pope” 和 “pops“ 将 匹配 ”pop “。 每 次 我 们 找到 一 个 匹配 的 桶 ， 我 们 就 把 单词 放 在 那个 

桶 。 一 旦 我 们 把 所 有 单词 放 到 适当 的 桶 中 ， 就 知道 桶 中 的 所 有 单词 必须 连接 。 


el Gel 


POPE POPE POPE POPE 
ROPE PIPE POLE POPS 
NOPE PAPE PORE 
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Figure 2 


在 Python 中 ， 我 们 使 用 字典 来 实现 我 们 刚才 描述 的 方案 。 我 们 刚才 描述 的 桶 上 的 标签 是 我 们 
字典 中 的 键 。 该 键 存储 的 值 是 单词 列表 。 一 旦 我 们 建立 了 字典 ， 我 们 可 以 创建 图 。 我 们 通过 
为 图 中 的 每 个 单词 创建 一 个 顶点 来 开始 图 。 然后 ， 我 们 在 字典 中 的 相同 键 下 找到 的 所 有 顶点 
创建 边 。Listing 1 展示 了 构建 图 所 需 的 Python 代码 。 


from pythonds.graphs import Graph 


def buildGraph(wordFile): 
GSS ats, 
g = Graph() 
wfile = open(wordFile, 'r') 
# create buckets of words that differ by one letter 
for line in wfile: 
word = line[:-1] 
for i in range(len(word)): 
bucket = word[:i] + '_' + word[it1:] 
if bucket in d: 
d[bucket] .append(word) 
else: 
d[bucket] = [word] 
# add vertices and edges for words in the same bucket 
for bucket in d.keys(): 
for word1 in d[bucket]: 
for word2 in d[bucket]: 
if word1 != word2: 
g.addEdge(word1, word2) 
return g 


Listing 1 


因为 这 是 我 们 的 第 一 个 夏 实 世界 图 问题 ， 你 可 能 想 知道 图 是 如 何 稀疏 ?3 这 个 问题 的 四 个 字母 
的 单词 列表 是 5,110 字 长 。 如 果 我 们 使 用 邻接 矩阵 ， 则 给 阵 将 具有 5,110 * 5,110 = 
26,112,100 个 格 。 由 buildGraph HAW AEWA 53,286 个 边 ， 所 以 矩阵 只 有 0.20% 


的 单元 格 填充 ! 这 是 一 个 非常 稀疏 的 矩阵 。 


7.9. 实 现 广 度 优 先 搜索 


通过 构建 图 ， 我 们 现在 可 以 将 e 的 算法 来 找到 字 梯 问题 的 最 短 解 。 我 们 
将 使 用 的 图 算法 称 为 “宽度 优先 搜索 算法。 宽度 优先 搜索 (BFS) 是 用 于 搜索 图 的 最 简单 的 算 
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从 s 开始 的 路 径 。 通 过 广度 优先 搜索 ， 它 找到 和 s 相距 k 的 所 有 顶点 ， 然 后 找到 距离 为 k+1 
的 所 有 顶点 。 可 视 化 广度 优先 搜索 算法 一 个 好 方法 是 想象 它 正在 建 一 棵 树 ， 一 次 建 一 层 。 广 
度 优先 搜索 先 从 其 他 起 始 顶 点 开始 添加 它 的 所 有 子 节点 ， 然 后 再 添加 其 子 节点 的 子 节 点 


为 了 跟踪 进度 ，BFS 将 每 个 顶点 着 色 为 和 白色， 灰色 或 黑色 。 当 它们 被 构造 时 ， 所 有 顶点 被 初 
始 化 为 白色 。 和 白色 顶点 是 未 发 现 的 顶点 。 当 一 个 顶点 最 初 被 发 现时 它 变 成 灰色 的 ， 当 BFS 完 
全 探索 完 一 个 顶点 时 ， 它 被 着 色 为 黑色 。 这 意味 着 一 旦 顶点 变 黑色 ， 就 没有 与 它 相 邻 的 白色 
顶点 。 另 一 方面 ， 灰 色 节 点 可 能 有 与 其 相 邻 的 一 些 白色 顶点， 表示 仍 有 额外 的 顶点 要 探索 。 


下 面 Listing 2 中 所 示 的 广度 优先 搜索 算法 使 用 我 们 先前 开发 的 邻接 表 表 示 。 此 外 ， 它 使 用 一 
个 Queue， 一 个 关键 的 地 方 ， 决 定 下 一 个 探索 的 顶点 。 


此 外 ，BFS 工法 使 用 Vertex 类 的 扩展 版 本 。 这 个 新 的 顶点 类 添加 了 三 个 新 的 实例 变 

量 : distance ， i ane 和 color 。 这 些 实例 变量 中 的 每 一 个 还 具有 适当 的 getter 
和 setter 方法 。 这 个 扩展 的 顶点 类 代码 包含 在 pythonds 包 中 ， 但 我 们 不 会 在 这 里 展示 它 ， 
因为 没有 新 的 需要 学 习 的 点 。 


BFS 从 起 始 顶 点 开始 ， 颜 色 从 灰色 开始 ， 表 明 它 正在 被 探索 。 另 外 两 个 值 ， 即 距离 和 前 导 ， 
对 于 起 始 顶 点 分 别 初始 化 为 0 和 None 。 最 后 ， 放 到 一 个 队列 中 。 下 一 步 是 开始 系统 地 检查 
队列 前 面 的 顶点 。 我 们 通过 和 迭代 它 的 邻接 表 来 探索 队列 前 面 的 每 个 新 节点 。 当 检查 邻接 表 上 
的 每 个 节点 时 ， 检 查 其 颜色 。 如 果 它 是 白色 的 ， 顶 点 是 未 开发 的 ， 有 四 件 事情 发 生 : 


新 的 ， 未 开发 的 顶点 nbr， 被 着 色 为 灰色 。 

nbr 的 前 导 被 设置 为 当前 节点 currentvert 

到 nbr 的 距离 设置 为 到 currentvert +1 的 距离 

nbr 被 添加 到 队列 的 末尾 。 将 nbr 添加 到 队列 的 末尾 有 效 地 调度 此 节点 以 进行 进一步 控 
索 ， 但 不 是 直到 currentvert 的 邻接 表 上 的 所 有 其 他 顶点 都 被 探索 。 
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from pythonds.graphs import Graph, Vertex 
from pythonds.basic import Queue 


def bfs(g,start): 
start.setDistance(0) 
start.setPred(None) 
vertQueue = Queue() 
vertQueue.enqueue(start) 
while (vertQueue.size() > 0): 
currentVert = vertQueue.dequeue( ) 
for nbr in currentVert.getConnections(): 
if (nbr.getColor() == 'white'): 
nbr.setColor('gray') 
nbr.setDistance(currentVert.getDistance() + 1) 
nbr.setPred(currentvVert ) 
vertQueue.enqueue(nbr ) 
currentVert.setColor('black') 


Listing 2 


让 我 们 看 看 bfs 函数 如 何 构造 对 应 于 Figure 1 中 的 图 的 广度 优先 树 。 开 始 我 们 取 所 有 与 
fool 相 邻 的 节点 ， 并 将 它们 添加 到 树 中 。 相 邻 节点 包括 pool, foil, foul, cool ° 这 
些 节点 被 添加 到 新 节点 的 队列 以 进行 扩展 。 Figure 3 展示 了 在 此 步骤 之 后 树 以 及 队列 的 状 
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Figure 3 


在 下 一 步骤 中 ，bfs 从 队列 的 前 面 删除 下 一 个 节点 ( pool) ， 并 对 其 所 有 相 邻 节点 重复 该 过 
程 。 然 而 ， 当 bfs 检查 节点 cool 时 ， 它 发 现 cool 的 颜色 已 经 改变 为 灰色 。 这 表明 有 一 条 
较 短 的 路 径 到 cool ， 并 且 cool 已 经 在 队列 上 进一步 扩展 。 在 检查 pool 期 间 添 加 到 队列 
的 唯一 新 节点 是 poll ° 树 和 队列 的 新 状态 如 Figure 4 所 示 。 
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队列 上 的 下 一 个 顶点 是 foil 。 foil 可 以 添加 到 树 中 的 唯一 新 节点 是 fail 。 4 bfs 继续 
处 理 队列 时 ， 接 下 来 的 两 个 节点 都 不 向 队列 或 树 添加 新 内 容 。 Figure 5 展示 了 在 树 的 第 二 级 
上 展开 所 有 顶点 之 后 的 树 和 队列 。 
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Figure 5-6 


你 应 该 自己 继续 完成 算法 ， 以 便 能 够 熟练 使 用 它 。Figure 6 展示 了 在 Figure 3 中 的 所 有 顶点 
都 被 扩展 之 后 的 最 终 广 度 优先 搜索 树 。 关 于 广度 优先 搜索 解决 方案 的 令 人 惊讶 的 事情 是 ， 我 
们 不 仅 解 决 了 我 们 开始 的 FooL-sAGE 问题 ， 还 解决 了 许多 其 他 问题 。 我 们 可 以 从 广度 优先 搜 
索 树 中 的 任何 顶点 开始 ， 并 沿 着 前 导 箭头 回 到 根 ， 找 到 从 任何 字 回 到 fool 的 最 短 的 词 梯 。 
下 面 的 函数 (Listing 3) 展示 了 如 何 按 前 导 链 接 打 印 出 字 梯 。 


def traverse(y): 
WS MY 
while (x.getPred()): 
print(x.getId()) 
x = x.getPred() 
print(x.getId()) 


traverse(g.getVertex('sage')) 


Listing 3 


7.10. 广 度 优 先 搜 索 分 析 


在 继续 使 用 其 他 图 算法 之 前 ， 让 我 们 分 析 广 度 优 先 搜索 算法 的 运行 时 性 能 。 首 先 要 观察 的 
是 ， 对 于 图 中 的 每 个 顶点 |v| 最 多 执行 一 次 while 循环 。 因 为 一 个 顶点 必须 是 白色 ， 才 能 被 
检查 和 添加 到 队列 。 这 给 出 了 用 于 while 循环 的 O(v) ° RE while 内 部 的 for 循环 对 于 图 中 
的 每 个 边 执 行 最 多 一 次 ，|E| 。 原 因 是 每 个 顶点 最 多 被 出 列 一 次 ， 并 且 仅 当 节 点 U 出 队 时 ， 
我 们 才 检 查 从 节点 U 到 节点 Vv 的 边 。 这 给 出 了 用 于 for 循环 的 O(E)。 组 合 这 两 个 环 路 给 出 了 
O(V+E) 。 
度 优 先 搜索 只 是 任务 的 一 部 分 。 从 起 始 节点 到 目标 节点 的 链接 之 后 是 任务 的 另 一 部 
最 粮 糕 的 情况 是 ， 如 果 图 是 单个 长 链 。 在 这 种 情况 下 ， 遍 历 所 有 顶点 将 是 O(V)。 正 常情 
IVI 的 一 小 部 分 但 我 们 仍然 写 O(V)。 
最 后 ， 至 少 对 于 这 个 问题 ， 存 在 构建 初始 图 形 所 需 的 时 间 。 我 们 把 build6raph 函数 的 分 析 
作为 一 个 练习 。 


7.11. 骑 士 之 旅 


另 一 个 经 典 问 题 ， 我 们 可 以 用 来 说 明 第 二 个 通用 图 算法 称 为 “骑士 之 旅 "。 骑 士 之 旅 图 是 在 一 
个 棋盘 上 用 一 个 棋子 当 骑 士 玩 。 图 的 目的 是 找到 一 系列 的 动作 ， 让 骑士 访问 板 上 的 每 格 一 

次 。 一 个 这 样 的 序列 被 称 为 "旅游 "。 了 骑士 的 旅游 难题 已 经 吸引 了 象棋 玩家 ， 数 学 家 和 计 章 机 科 
学 家 多 年 。 一 个 8x8 棋盘 的 可 能 的 游览 次 数 的 上 限 为 1.305x10^35 ;然而 ， 还 有 更 多 可 能 的 死 
胡同 。 显 然 ， 这 是 一 个 需要 脑力 ， 计 算 能 力 ， 或 两 者 都 需要 的 问题 。 


虽然 研究 人 员 已 经 研究 了 许多 不 同 的 算法 来 解决 骑士 的 旅游 问题 ， 图 搜索 是 最 容易 理解 的 程 
序 之 一 。 再 次 ， 我 们 将 使 用 两 个 主要 步骤 解决 问题 : 


© 表示 骑士 在 棋盘 上 作为 图 的 动作 。 
e。 使 用 图 算法 来 查找 长 度 为 rowsxcolumns-1 的 路 径 ， 其 中 图 上 的 每 个 顶点 都 被 访问 一 次 。 


7.12. 构 建 骑 士 之 旅 图 


7.12. 构 建 骑士 之 旅 图 


为 了 将 骑士 的 旅游 问题 表示 为 图 ， 我 们 将 使 用 以 下 两 个 点 : 棋盘 上 的 每 个 正方 形 可 以 表示 为 
图 形 中 的 一 个 节点 。 骑士 的 每 个 合法 移动 可 以 表示 为 图 形 中 的 边 。Figure 1 展示 了 骑士 的 移 
动 以 及 图 中 的 对 应 边 。 





Figure 1 


要 构建 一 个 nxn 的 完整 图 ， 我 们 可 以 使 用 Listing 1 中 所 示 的 Python 函数 。 knightGraph %® 
数 在 整个 板 上 进行 一 次 遍历 。 在 板 上 的 每 个 方块 上 ， knightGraph 函数 调用 genLegalMoves 

， 为 板 上 的 位 置 创 建 一 个 移动 列表 。 所 有 移动 在 图 形 中 转换 为 边 。 另 一 个 帮助 函数 
posToNodeId 按照 行 和 列 将 板 上 的 位 置 转换 为 类 似 于 Figure 1 所 示 的 顶点 数 的 线性 顶点 数 。 


from pythonds.graphs import Graph 


def knightGraph(bdSize): 
ktGraph = Graph() 
for row in range(bdSize): 
for col in range(bdSize): 
nodeId = posToNodeld(row, col, bdSize) 
newPositions = genLegalMoves(row, col, bdSize) 
for e in newPositions: 
nid = posToNodelId(e[0],e[1],bdSize) 
ktGraph.addEdge(nodelId, nid) 
return ktGraph 


def posToNodelId(row, column, board_size): 
return (row * board_size) + column 
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Listing 1 


genLegalMoves 2k (Listing 2) 使 用 板 上 骑士 的 位 置 ， 并 生成 八 个 可 能 移动 中 的 一 个 。 
legalcoord 辅助 函数 (Listing 2) 确保 生成 的 特定 移动 仍 在 板 上 。 


def genLegalMoves(x,y,bdSize): 
newMoves = [] 
moveOffsets = [(-1,-2),(-1,2),(-2,-1),(-2,1), 
( 1,-2),( 1,2),( 2,-1),( 2,1)] 
for i in moveOffsets: 
newX = x + i[0] 
newY = y + i[1] 
if legalCoord(newX,bdSize) and \ 
legalCoord(newY, bdSize): 
newMoves.append( (newX, newY ) ) 
return newMoves 


def legalCoord(x,bdSize): 
if x >= 0 and x < bdSize: 
return True 
else: 
return False 


Listing 2 
Figure 2 展示 了 一 个 8x8 板 的 可 能 移动 的 完整 图 。 图 中 有 正好 336 个 边 。 注意 ， 与 板 的 边 相 


对 应 的 顶点 具有 上 比 板 中 间 的 顶点 更 少 的 连接 (移动 数 ) 。 再 次 我 们 可 以 看 到 图 的 稀疏 。 如 果 
图 形 完全 连接 ， 则 会 有 4,096 个 边 。 由 于 只 有 336 Hid > MEERA 8.2% JFL © 
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Figure 2 
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7.13. 实 现 骑士 之 旅 


E ania eee Rey 。 尽 管 在 前 面部 分 中 讨 
论 的 广度 优先 搜索 算法 一 次 建立 一 个 搜索 树 ， 但 是 深度 优先 搜索 通过 尽 可 能 深 地 探索 树 的 一 
个 分 支 来 创建 搜索 树 。 在 本 节 中 ， 我 们 将 介绍 实现 深度 优先 搜索 的 。 我 们 将 看 到 的 
第 一 个 算法 通过 明确 地 禁止 一 个 节点 被 访问 多 次 来 直接 解决 骑士 的 旅行 问题 。 第 二 种 实现 是 
更 通用 的 ， 但 是 允许 在 构建 树 时 多 次 访问 节点 。 第 二 个 版 本 在 后 续 部 分 中 用 于 开发 其 他 图 形 
算法 。 


图 的 深度 优先 搜索 正 是 我 们 需要 的 ， 来 找到 有 63 个 边 的 路 径 。 我 们 将 看 到 ， 当 深度 优先 搜索 
算法 找到 死角 (图 中 没有 可 移动 的 地 方 ) 时 ， 它 将 回 到 下 一 个 最 深 的 顶点 ， 人 允许 它 进行 移 
动 。 


knightTour 加 数 有 四 个 参数 : n ， 搜 索 树 中 的 当前 深度 ; path ， 到 此 为 止 访问 的 顶点 的 列 
Ši u ， 图 中 我 们 希望 探索 的 顶点 ;1imit 路 径 中 的 节点 数 。 knightTour 函数 是 递归 的 。 当 
调用 knightTour 哆 数 时 ， 它 首先 检查 基本 情况 。 如 果 我 们 有 一 个 包含 64 个 顶点 的 路 径 ， 
我 们 状态 为 True 1” knightTour 返回 ， 表 示 我 们 找到 了 一 个 成 功 的 线路 。 如 果 路 径 不 够 
长 ， 我 们 继续 通过 选择 一 个 新 的 顶点 来 探索 一 层 ， 并 对 这 个 顶点 递归 调用 knightTour ° 


DFS 还 使 用 颜色 来 跟踪 图 中 的 哪些 顶点 已 被 访问 。 未 访问 的 顶点 是 白色 的 ， 访 问 的 顶点 是 灰 
色 的 。 如 果 已 经 探索 了 特定 顶点 的 所 有 邻居 ， 并 且 我 们 尚未 达到 64 个 顶点 的 目标 长 度 ， 我 们 
已 经 到 达 死 明 同 。 当 我 们 到 达 死 胡同 时 ， 我 们 必须 回 淹 。 当 我 们 从 状态 为 False 的 knightTour 
返回 时 ， 发 生 回溯 。 在 广度 优先 搜索 中 ， 我 们 使 用 一 个 队列 来 跟踪 下 一 个 要 访问 的 顶点 。 由 

于 深度 优先 搜索 是 递归 的 ， 我 们 隐 式 使 用 一 个 栈 来 帮助 我 们 回溯 。 当 我 们 从 第 11 行 的 状态 为 
False 的 knightTour 调用 返回 时 ， 我 们 保持 在 while 循环 中 ， 并 查看 nbrList 中 的 下 一 个 顶 
Bas 


from pythonds.graphs import Graph, Vertex 
def knightTour(n,path,u, limit): 
u.setColor('gray') 
path.append(u) 
if n < limit: 
nbrList = list(u.getConnections() ) 
i=0 
done = False 
while i < len(nbrList) and not done: 


if nbrList[i].getColor() == 'white': 
done = knightTour(n+1, path, nbrList[i], limit) 
i=i+1 


if not done: # prepare to backtrack 


path.pop() 
u.setColor('white') 
else: 
done = True 
return done 


Listing 3 


让 我 们 看 看 一 个 简单 的 例子 knightTour ° 你 可 以 按照 搜索 的 步 又 参考 下 面 的 图 。 对 于 这 个 
例子 ， 我 们 假设 对 第 6 行 的 getConnections 方法 的 调用 按 字 母 顺序 对 节点 排序 。 我 们 首先 调 
用 knightTour(90，path，A，6) 


Figure 中 knightTour 从 节点 A 开 始 .与 A 相 邻 的 节点 是 B 和 D。 由 于 B 在 字母 D 之 前 ， 
DFS 选 择 B 展开 下 一 个 ， 如 Figure 4 所 示 。 当 knightTour 被 递归 调用 时 ， 开 始 从 B 开始 探 
寻 。B 与 C 和 DD 相 领 ,所 以 knightTour 选择 接 下 来 探索 C。 然 而 ， 如 Figure 5 所 示 ， 节 点 
C 是 没有 相 邻 节点 的 死胡同 。 此 时 ， 我 们 将 节点 C 的 颜色 更 改 为 白色 。 对 knightTour 的 调用 
返回 值 False。 从 递归 调用 的 返回 有 效 地 将 搜索 回溯 到 顶点 B (参见 Figure 6) 。 列 表 中 要 探 
索 的 下 一 个 顶点 是 顶点 D， 因 此 knightTour 使 递归 调用 移动 到 节点 D (参见 Figure 7) °M 
顶点 D 开始 ， knightTour 可 以 继续 进行 递归 调用 ， 直 到 我 们 再 次 到 达 节 点 C (参见 Figure 
8，Figure 9 和 Figure 10) 。 然 而 ， 当 我 们 到 达 节 点 C 时 ， 测 试 n <limit 失败 ， 所 以 我 们 知 
道 已 经 耗 尽 了 图 中 的 所 有 节点 。 在 这 一 点 上 ， 我 们 可 以 返回 True， 表 示 我 们 已 经 成 功 地 浏览 

了 图 。 当 我 们 返回 列表 时 ， 路 径 具 有 值 [A，B，D，E，F，C]， 这 是 我 们 需要 遍历 图 以 访问 每 
个 节点 的 顺序 。 


7.13. 实 现 骑士 之 旅 
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7.13. 实 现 骑士 之 旅 








Figure 3-10 


Figure 11 展示 了 一 个 8x8 板 的 完整 遍历 。 有 许多 可 能 的 路 径 ; 一 些 是 对 称 的 。 通过 一 些 修 
改 ， 你 可 以 使 遍历 开始 和 结束 在 同一 个 正方 形 。 
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7.14. 骑 士 之 旅 分 析 


有 最 后 关于 骑士 之 旅 一 个 有 趣 的 话题 ， 然 后 我 们 将 继续 到 深度 优先 搜索 的 通用 版 本 。 主 题 是 
性 能 。 特 别 是 ， knightTour 对 于 你 选择 下 一 个 要 访问 的 顶点 的 方法 非常 敏感 。 例 如 ， 在 一 个 
5 乘 5 的 板 上 ， 你 可 以 在 快速 计算 机 上 处 理 路 径 花 费 大 约 1.5 秒 。 但 是 如 果 你 尝试 一 个 8x8 的 
板 ， 会 发 生 什么 ?了 在 这 种 情况 下 ， 根 据 计 算 机 的 速度 ， 你 可 能 需要 等 待 半 小 时 才能 获得 结 
Al 这 样 做 的 原因 是 我 们 到 目前 为 止 所 实现 的 骑士 之 旅 问 题 是 大 小 为 O(KAN ) 的 指数 算法 ， 
其 中 N 是 棋盘 上 的 方 格 数 ，k 是 小 常数 。Figure 12 可 以 帮助 我 们 搞 清楚 为 什么 会 这 样 。 树 的 
根 表示 搜索 的 起 点 。 从 那里 ， 算 法 生成 并 检查 骑士 可 以 做 出 的 每 个 可 能 的 移动 。 正 如 我 们 之 
前 注意 到 的 ， 可 能 的 移动 次 数 取决 于 骑士 在 板 上 的 位 置 。 在 角落 只 有 两 个 合法 的 动作 ， 在 角 
落 邻 近 的 正方 形 有 三 个 ， 在 板 的 中 间 有 八 个 。Figure 13 展示 了 板 上 每 个 位 置 可 能 的 移动 次 
数 。 在 树 的 下 一 级 ， 再 次 有 2 到 8 个 可 能 的 下 一 个 移动 。 要 检查 的 可 能 位 置 的 数量 对 应 于 搜 
索 树 中 的 节点 的 数量 。 











Figure 12-13 


我 们 已 经 看 到 ， 高 度 N 的 二 又 树 中 的 节点 数量 是 2\N+1 - 1。 对 于 具有 可 以 具有 多 达 八 个 孩子 
而 不 是 两 个 节点 的 树 ， 节 点 的 数量 要 大 得 多 。 因 为 每 个 节点 的 分 支 因子 是 可 变 的 ， 我 们 可 以 
使 用 平均 分 支 因 子 估 计 节 点 的 数量 。 重 要 的 是 要 注意 ， 这 个 算法 是 指数 : KAN+1 - 1， 其 中 kK 
是 板 的 平均 分 支 因 子 。 让 我 们 看 看 这 增长 有 多 快 ! 对 于 5x5 的 板 ， 树 将 是 25 级 深 ， 或 者 N = 
24， 将 第 一 级 算 为 级 0。 平均 分 支 因 子 是 k= 3.8 因此 ， 搜 索 树 中 的 节点 数量 是 3.8^25 - 1 或 
3.12x10^14 。 对 于 6x6 板 ，k = 4.4， 有 1.5x10^23 个 节点 ， 对 于 常规 的 8x8 棋盘 ，k = 5.25 
> A 1.3x10°46 。 当 然 ， 由 于 问题 有 多 个 解决 方案 ， 我 们 不 必 去 探索 每 个 节点 ， 但 是 我 们 必 
须 探 索 的 节点 的 小 数 部 分 只 是 一 个 不 会 改变 问题 的 指数 性 质 的 常数 乘 数 。 我 们 将 把 它 作为 一 
个 练习 ， 看 看 你 是 否 可 以 表示 Kk 作为 板 的 大 小 的 函数 。 


幸运 的 是 有 一 种 方法 来 加 速 八 乘 八 的 情况 ， 使 其 在 一 秒 钟 内 运行 完成 。 在 下 面 的 列表 中 ， 我 
们 将 展示 加 速 knightTour 的 代码 。 这 个 函数 〈 见 Listing 4) ， 被 称 为 orderbyAvail 将 被 用 
来 代替 上 面 代码 中 对 u.getConnections 的 调用 。 orderByAvail 函数 中 的 关键 是 第 10 行 。 此 
行 确保 我 们 选择 具有 最 少 可 用 移动 的 下 一 个 顶点 。 你 可 能 认为 这 具有 相反 效果 ; 为 什么 不 选择 
具有 最 多 可 用 移动 的 节点 ?你 可 以 通过 运行 该 程序 并 在 排序 后 插入 行 resList.reverse() KZ 
试 该 方法 。 


使 用 具有 最 多 可 用 移动 的 顶点 作为 路 径 上 的 下 一 个 顶点 的 问题 是 ， 它 倾向 于 让 骑士 在 游览 中 
早 访问 中 间 的 方 格 。 当 这 种 情况 发 生 时 ， 骑 士 很 容易 陷入 板 的 一 侧 ， 在 那里 它 不 能 到 达 在 板 
的 另 一 侧 的 未 访问 的 方 格 。 另 一 方面 ， 访 问 具有 最 少 可 用 移动 的 方块 首先 推动 骑士 访问 围绕 
板 的 边缘 的 方块 。 这 确保 了 骑士 能 够 尽早 地 访问 难以 到 达 的 角落 ， 并 且 只 有 在 必要 时 才 使 用 
中 间 的 方块 跳 过 棋盘 。 利 用 这 种 知识 加 速算 法 被 称 为 启发 式 。 人 类 每 天 都 使 用 尼 发 式 来 帮助 
做 出 决策 2 启 发 式 搜 索 通 常用 于 人 工 智 能 领域 g 这 个 特定 的 局 发 式 称 为 Warnsdorff 算法 > 

由 H. c. Warnsdorff 命名 ， 他 在 1823 年 发 表 了 他 的 算法 。 


def orderByAvail(n): 
resList = [] 
for v in n.getConnections(): 


if v.getColor() == 'white': 
c = 0 
for w in v.getConnections(): 
if w.getColor() == 'white': 
GE=S Co tl 


resList.append((c,v)) 
resList.sort(key=lambda x: x[0]) 
return [y[1] for y in resList] 
Next Section - 7.15. General Depth First Search 


7.15. 通 度 优先 搜索 


骑士 之 旅 是 深度 优先 搜索 的 特殊 情况 ， 其 目的 是 创建 最 深 的 第 一 棵 树 ， 没 有 任何 分 支 。 更 一 
级 的 深度 优先 搜索 实际 上 更 容易 。 它 的 目标 是 尽 可 能 深 的 搜索 ， 在 图 中 连接 尽 可 能 多 的 节 
点 ， 并 在 必要 时 创建 分 支 


甚至 可 能 的 是 ， 深 度 优 先 搜 索 将 创建 多 于 一 个 树 。 当 深度 优先 搜索 算法 创建 一 组 树 时 ， 我 们 
称 之 为 深度 优先 森林 。 与 广度 优先 搜索 一 样 ， 我 们 的 深度 优先 搜索 使 用 前 导 链接 来 构造 树 。 
此 外 ， 深 度 优 先 搜 索 将 在 顶点 类 中 使 用 两 个 附加 的 实例 变量 。 新 实例 变量 是 发 现 和 完成 时 
闻 。 发 现时 间 跟 踪 首次 遇 到 顶点 之 前 的 步骤 数 。 完 成 时 间 是 顶点 着 色 为 黑色 之 前 的 步骤 数 。 
正如 我 们 看 到 的 算法 ， 节 点 的 发 现 和 完成 时 间 提 供 了 一 些 有 趣 的 属性 ， 我 们 可 以 在 以 后 的 算 
法 中 使 用 。 


我 们 深度 优先 搜索 的 代码 如 Listing 5 所 示 。 由 于 dfs 4 C4) W BA dfsvisit 这 两 个 函数 使 
Bee eter dfsvisit 的 时 间 ， 所 以 我 们 选择 将 代码 实现 为 继承 自 Graph Ko wb 
实现 通过 添加 时 间 实 例 变量 和 两 个 方法 dfs 和 dfsvisit 来 扩展 Sen 类 。 看 看 第 11 行 ， 
你 会 注意 到 ， dfs 方法 在 调用 dfsvisit 的 图 中 所 有 的 顶点 迭代 ， 这 些 节点 是 白色 的 。 ok 
和 迭代 所 有 节点 而 不 是 简单 地 从 所 选择 的 起 始 节点 进行 搜索 的 原因 是 为 了 确保 图 中 的 所 有 节 

都 被 考虑 到 ， 没 有 顶点 从 深度 优先 森林 中 被 遗漏 。 for avertex in self 744) Tf RRA 
常 ， 但 请 记 住 ， 在 这 种 情况 下 ， self Æ DpFsGraph 类 的 一 个 实例 ， 遍 历 实例 中 的 所 有 顶点 是 
a 


from pythonds.graphs import Graph 
class DFSGraph(Graph): 
def _ init__(self): 
super().__init__() 
self.time = 0 


def dfs(self): 
for aVertex in self: 
aVertex.setColor('white' ) 
aVertex.setPred(-1) 
for aVertex in self: 
if aVertex.getColor() == 'white': 
self .dfsvisit(aVertex) 


def dfsvisit(self,startVertex): 

startVertex.setColor('gray') 

self.time += 1 

startVertex.setDiscovery(self.time) 

for nextVertex in startVertex.getConnections(): 

if nextVertex.getColor() == 'white': 

nextVertex.setPred(startVertex) 
self .dfsvisit(nextVertex) 

startVertex.setColor('black') 

self.time += 1 

startVertex.setFinish(self.time) 


Listing 5 


虽然 我 们 bfs 的 实现 只 对 有 一 条 路 径 回 到 开始 的 路 径 的 节点 感 兴 趣 ， 但 是 有 可 能 创建 一 个 宽 
度 优先 森林 ， 其 表示 图 中 的 所 有 节点 之 间 的 最 短路 径 。 我 们 把 这 作为 一 个 练习 。 在 接 下 来 的 
两 个 算法 中 ， 我 们 将 看 到 为 什么 跟踪 深度 优先 森林 的 深度 很 重要 。 


dfsvisit 方法 从 名 为 startvertex 的 单个 顶点 开始 ， 并 尽 可 能 深 地 探查 所 有 相 邻 的 白色 顶 
点 。 如 果 仔 细 查 看 dfsvisit 的 代码 并 将 其 与 广度 优先 搜索 进行 比较 ， 应 该 注意 的 

Æ? dfsvisit 算法 几乎 与 bfs 相同 ， 除 了 在 内 部 for 循环 的 最 后 一 行 ， dfsvisit 将 自行 
递归 调用 以 继续 在 更 深 的 级 别 搜索 ， 而 pts 将 节点 添加 到 队列 以 供 稍 后 探查 。 有 趣 的 

是 ， bfs 使 用 队列 ， dfsvisit 使 用 栈 。 你 在 代码 中 没有 看 到 栈 ， 但 是 它 在 dfsvisit ib 
归 调 用 中 是 隐 含 的 。 


以 下 图 的 序列 展示 了 针对 小 图 的 深度 优先 搜索 算法 。 在 这 些 图 中 ， 虚 线 指示 检查 的 边 ， 但 是 
在 边 的 另 一 端的 节点 已 经 被 添加 到 深度 优先 树 。 在 代码 中 ， 通 过 检查 另 一 个 节点 的 颜色 是 非 
白色 的 。 


搜索 从 图 的 顶点 A 开 始 (Figure 14) 。 由 于 所 有 顶点 在 搜索 开始 时 都 是 白色 的 ， 所 以 算法 访 
问 顶点 A。 访 问 顶点 的 第 一 步 是 将 颜色 设置 为 灰色 ， 这 表示 正在 探索 顶点 ， 并 且 将 发 现时 间 
设置 为 1， 由 于 顶点 A 具 有 两 个 相 邻 的 顶点 (B，D) ， 因 此 每 个 顶点 也 需要 被 访问 。 我 们 将 
做 出 任意 决定 ， 我 们 将 按 字母 顺序 访问 相 邻 顶点 。 


接 下 来 访问 顶点 B (Figure 15) ， 因 此 其 颜色 设置 为 灰色 并 且 其 发 现时 间 被 设置 为 2。 顶点 BB 
也 与 两 个 其 他 节点 (CD) 相 邻 ， 因 此 我 们 将 遵循 字母 顺序 和 访问 节点 C 接 下 来 。 


访问 顶点 C (Figure16) 使 我 们 到 树 的 一 个 分 支 的 末端 。 在 将 节点 灰色 着 色 并 将 其 发 现时 间 
设置 为 3 之 后 ， 算 法 还 确定 没有 与 C 相 邻 的 顶点 。 这 意味 着 我 们 完成 了 对 节点 C 的 探索 ， 
此 我 们 可 以 将 顶点 着 色 为 黑色 ， 并 将 完成 时 间 设 置 为 4， 在 Figure 17 中 ， 可 以 看 到 我 们 的 搜 
索 的 状态 。 


由 于 顶点 C 是 一 个 分 支 的 结束 ， 我 们 现在 返回 到 顶点 B， 继 续 探索 与 B 相 邻 的 节点 。 从 BB 中 
探索 的 唯一 额外 的 顶点 是 D， 所 以 我 们 现在 可 以 访问 D (Figure 18) ， 并 继续 搜索 顶点 D。 
顶点 D 快速 引导 我 们 到 顶点 E (Figure 19) 。 顶 点 巨 具 有 两 个 相 邻 的 顶点 B 和 下 。 通 常 我 
们 将 按 字母 顺序 探索 这 些 相 邻 顶 点 ， 但 是 由 于 B 已 经 是 灰色 的 ， 所 以 算法 识别 出 它 不 应 该 访 
问 B， 因 为 这 样 做 会 将 算法 置 于 御 环 中 ! 因此， 继续 探索 列表 中 的 下 一 个 顶点 ， 即 F (Figure 
20) ° 


顶点 F 只 有 一 个 相 邻 的 顶点 C， 但 由 于 C 是 黑色 的 ， 没 有 别 的 东西 可 以 探索 ， 算 法 已 经 到 达 
另 一 个 分 支 的 结束 。 从 这 里 开始 ， 你 将 在 Figure 21 至 Figure 25 中 看 到 算法 运行 回 到 第 一 个 
节点 ， 设 置 完 成 时 间 和 着 色 顶 点 为 黑色 。 


7.15. 通 用 深度 优先 搜索 
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Figure 14-25 


每 个 节点 的 开始 和 结束 时 间 展 示 一 个 称 为 ”括号 属性 的 属性 。 该 属性 意味 着 深度 优先 树 中 的 特 
定 节点 的 所 有 子 节点 具有 比 它们 的 父 节点 更 晚 的 发 现时 间 和 更 旱 的 完成 时 间 。 Figure 26 展示 
了 由 深度 优先 搜索 算法 构造 的 树 。 
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Figure 26 


7.16. 深 度 优 先 搜 索 分 析 


深度 优先 搜索 的 一 般 运 行 时 间 如 下 。 dfs 中 的 循环 都 在 O(V) 中 运行 ， 不 计 入 dfsvisit 中 发 
生 的 情况 ， 因 为 它们 对 图 中 的 每 个 顶点 执行 一 次 。 在 dfsvisit 中 ， 对 当前 顶点 的 邻接 表 中 
的 每 个 边 执行 一 次 循环 。 由 于 只 有 当 顶 点 为 白色 时 ， dfsvisit 才 被 递归 调用 ， 所 以 循环 对 
图 中 的 每 个 边 或 O(E) 执行 最 多 一 次 。 因此， 深度 优先 搜索 的 总 时 间 是 O(V + E)。 


7.17. 拓 扑 排 序 


为 了 表明 计算 机 科学 家 可 以 把 任何 东西 变 成 一 个 图 问题 ， 让 我 们 考虑 做 一 批 区 人 饼 的 问题 。 菜 
WARA: 1 个 鸡蛋 ，1 杯 煎饼 粉 ，1 汤 是 油 和 3/4 杯 牛 奶 。 要 制作 商人 饼 ， 你 必须 加 热 炉 
子 ， 将 所 有 的 成 分 混合 在 一 起 ， 勺 子 搅拌 。 当 开 始 冒 泡 ， 你 把 它们 翻 过 来 ， 直 到 他 们 底部 变 
金黄 色 。 在 你 吃 交 人 饼 之 前 ， 你 会 想 要 加 热 一 些 糖浆 。 Figure 27 将 该 过 程 示 为 图 。 


Figure 27 


4 VEL A BY) DR xf 2k Ho AK A o M Figure 27 可 以 看 出 ， 你 可 以 从 加 热 前 人 饼 开 始 ， 或 通过 添 
加 任何 成 分 到 煎饼 。 为 了 帮助 我 们 决定 应 该 做 的 每 一 个 步骤 的 精确 顺序 ， 我 们 转向 一 个 图 算 
法 称 为 ”拓扑 排序 。 


拓扑 排序 采用 有 向 无 环 图 ， 并 且 产 生 所 有 其 顶点 的 线性 排序 ， 使 得 如 果 图 G 包含 边 〈v， 

w) ， 则 顶点 V 在 排序 中 位 于 顶点 W 之 前 。 定 向 非 循环 图 在 许多 应 用 中 使 用 以 指示 事件 的 优 
先 级 。 制 作 煎饼 只 是 一 个 例子 ;其 他 示例 包括 软件 项 目 计划 ， 用 于 数据 库 查 询 的 优先 图 以 及 乘 
法 矩阵 。 


拓扑 排序 是 深度 优先 搜索 的 简单 但 有 用 的 改造 。 拓 扑 排 序 的 算法 如 下 : 


1， 对 于 某 些 图 g 调用 dfs(g)。 我 们 想 要 调用 深度 优先 搜索 的 主要 原因 是 计算 每 个 顶点 的 完 
成 时 间 。 
2， 以 完成 时 间 的 递减 顺序 将 顶点 存储 在 列表 中 。 


3. 返回 有 序列 表 作 为 拓扑 排序 的 结果 。 


Figure 28 展示 了 在 Figure 26 PT Ray HAL IEA LW dfs 构建 的 深度 优先 森林 。 
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Figure 28 


最 后 ，Figure 29 展示 了 将 拓扑 排序 算法 应 用 于 我 们 的 图 形 的 结果 。 MEMAND AERA 
除 ， 我 们 知道 确切 的 做 章 饼 的 步骤 顺序 。 


Figure 29 


7.18. 强 连通 分 量 


在 本 章 的 剩余 部 分 ， 我 们 将 把 注意 力 转 向 一 些 非常 大 的 图 。 我 们 将 用 来 研究 一 些 附 加 算法 的 
图 ， 由 互联 网 上 的 主机 之 间 的 连接 和 网 页 之 间 的 链接 产生 的 图 。 我 们 将 从 网 页 开始 。 


像 Google 和 Bing 这 样 的 搜索 引擎 利用 了 网 页 上 的 页 面 形成 非常 大 的 有 向 图 。 为 了 将 万 维 网 
变换 为 图 ， 我 们 将 把 一 个 页 面 视 为 一 个 顶点 ， 并 将 页 面 上 的 起 链接 作为 将 一 个 顶点 连接 到 另 
一 个 顶点 的 边缘 。 Figure 30 展示 了 从 Luther College 的 计算 机 科学 主页 开始 ， 通 过 跟踪 从 一 
页 到 下 一 页 的 链接 产生 的 图 的 非常 小 的 部 分 。 当 然 ， 这 个 图 可 能 是 巨大 的 ， 所 以 我 们 把 它 限 
制 在 距离 CS 主页 不 超过 10 个 链接 的 网 站 。 
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Figure 30 


to RIK A Figure 30 中 的 图 形 ， 你 可 能 会 有 一 些 有 趣 的 观察 。 首 先 你 可 外 
多 其 他 网 站 是 其 他 路 德 学 院 网 站 。 第 二 ， 你 可 能 注意 到 有 几 个 链接 到 爱 
第 三 ， 你 可 能 注意 到 有 几 个 链接 到 其 他 文理 学 院 。 你 可 能 会 得 出 这 样 的 
网 站 在 一 些 级 别 上 底层 结构 类 似 。 


EE 会 注意 到 ， 图 上 的 许 
疹 华 州 的 其 他 学 院 。 
结论 ， 网 络 集群 上 的 


可 以 帮助 找到 图 中 高 度 互 连 的 顶点 的 集群 的 一 种 图 算法 被 称 为 强 连 通 分 量 算法 (SCC) 。 我 
们 正式 定义 图 G 的 强 连通 分 量 C 作为 顶点 CCV 的 最 大 子 集 ， 使 得 对 于 每 对 顶点 VWEC? R 
们 具有 从 vV 到 W 的 路 径 和 从 w 到 Vv 的 路 径 。Figure 27 展示 了 具有 三 个 强 连 接 分 量 的 简单 
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7.18. 强 连通 分 量 


图 。 强 连接 分 量 由 不 同 的 阴影 区 域 标识 。 
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Figure 27 


一 旦 确定 了 强 连通 分 量 ， 我 们 就 可 以 通过 将 一 个 强 连 通 分 量 中 的 所 有 顶点 组 合成 一 个 较 大 的 
顶点 来 显示 该 图 的 简化 视图 。 Figure 31 中 的 曲线 图 的 简化 版 本 如 Figure 32 所 示 。 


ABDEG <> 


Figure 32 

我 们 再 次 看 到 ， 我 们 可 以 通过 使 用 深度 优先 搜索 来 创建 一 个 非常 强大 和 高 效 的 算法 。 在 我 们 
处 理 主 SCC 算法 之 前 ， 我 们 必须 考虑 另 一 个 定义 。 图 G 的 转 置 被 定义 为 图 GT ， 其 中 图 中 
的 所 有 边 已 经 反 转 。 也 就 是 说 ， 如 果 在 原始 图 中 存在 从 节点 A 到 节点 B 的 有 向 边 ， 则 G^T 
将 包含 从 节点 B 到 节点 A 924 © Figure 33 和 Figure 34 展示 了 简单 图 及 其 变换 。 
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Figure 33-34 


再 看 看 数字 。 请 注意 ，Figure 33 中 的 图 形 有 两 个 强 连通 分 量 。 现在 看 看 Figure 34° ERE 
也 有 两 个 强 连 通 分 量 。 


我 们 现在 可 以 描述 用 于 计算 图 的 强 连通 分 量 的 算法 。 


调用 dfs 为 图 G 计算 每 个 顶点 的 完成 时 间 。 

计算 GAT。 

为 图 GAT 调用 dfs， 但 在 DFS 的 主 循环 中 ， 以 完成 时 间 的 递减 顺序 探查 每 个 顶点 。 
在 步骤 3 中 计算 的 森林 中 的 每 个 树 是 强 连通 分 量 。 输 出 森林 中 每 个 树 中 每 个 顶点 的 顶点 
标识 组 件 。 


FON = 


让 我 们 在 Figure 31 中 的 示例 图 上 跟踪 上 述 步骤 的 操作 。Figure 35 展示 了 由 DFS 算法 为 原始 
图 计算 的 开始 和 结束 时 间 。 Figure 36 展示 了 通过 在 转 置 图 上 运行 DFS 计算 的 开始 和 结束 时 





间 。 
Figure 36 


最 后 ，Figure 37 展示 了 在 强 连 通 分 量 算法 的 步骤 3 中 产生 的 三 棵 树 的 森林 。 你 会 注意 到 ， 我 
们 不 为 你 提供 SCC 算法 的 Python 代码 ， 我 们 将 此 程序 作为 练习 。 
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7.18. 强 连通 分 





Figure 37 
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7.19. 最 短路 径 问 题 


当 你 在 网 上 冲浪 ， 发 送 电子 邮件 ， 或 从 校园 的 另 一 个 地 方 登 录 实 验 室 计 算 机 时 ， 大 量 的 工作 
正在 幕后 进行 ， 以 获取 你 计算 机 上 的 信息 传输 到 另 一 台 计 算 机 。 深入 研究 信息 如 何 通 过 互联 
网 从 一 台 计 算 机 流向 另 一 台 计 算 机 是 计算 机 网 络 中 的 一 个 主要 课题 。 然而， 我 们 将 讨论 互联 
网 如 何 工 作 足 以 理解 另 一 个 非常 重要 的 图 算法 。 
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Figure 1 


Figure 1 展示 了 Internet 上 的 通信 如 何 工作 的 高 层 概述 。 当 使 用 浏览 器 从 服务 器 请 求 网 页 时 ， 
请 求 必 须 通过 局 域 网 传输 ， 并 通过 路 由 器 传输 到 Internet 上 。 该 请 求 通过 因特网 传播 ， 并 最 
终 到 达 服 务 器 所 在 的 局 域 网 路 由 器 。 请 求 的 网 页 然后 通过 相同 的 路 由 器 回 到 您 的 浏览 器 。 在 
Figure 1 中 标记 为 “因特网 ” 的 云 是 附加 的 路 由 器 。 所 有 这 些 路 由 器 一 起 工作 ， 让 信息 从 一 个 地 
方 到 另 一 个 地 方 。 可 以 看 到 有 许多 路 由 器 ， 如 果 你 的 计算 机 支持 traceroute 命令 。 下 面 的 
文本 显示 traceroute 命令 的 输出 ， 说 明 在 Luther College 的 Web 服 务 器 和 明尼苏达 大 学 的 
邮件 服务 器 之 间 有 13 个 路 由 器 
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Routers from One Host to the Next over the Internet 


互联 网 上 的 每 个 路 由 器 都 连接 到 一 个 或 多 个 路 由 器 。 因 此 ， 如 果 在 一 天 的 不 同时 间 运 行 
traceroute 命令 ， 你 很 可 能 会 看 到 你 的 信息 在 不 同 的 时 间 流 经 不 同 的 路 由 器 。 这 是 因为 存在 与 
一 对 路 由 器 之 间 的 每 个 连接 相关 联 的 成 本 ， 这 取决 于 业务 量 ， 一 天 中 的 时 间 以 及 许多 其 他 因 
素 。 到 这 个 时 候 ， 你 不 会 惊讶 ， 我 们 可 以 将 路 由 器 的 网 络 表示 为 带 有 加 权 边 的 图 形 。 
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Figure 2 展示 了 表示 互联 网 中 的 路 由 器 的 互 连 的 加 权 图 的 一 个 小 例子 。 我 们 要 解决 的 问题 是 
找到 具有 最 小 总 权重 的 路 径 ， 沿 着 该 路 径路 由 传送 任何 给 定 的 消息 。 这 个 问题 听 起 来 很 熟 
悉 ， 因 为 它 类 似 于 我 们 使 用 广度 优先 搜索 解决 的 问题 ， 我 们 这 里 关心 的 是 路 径 的 总 权重 ， 而 
不 是 路 径 中 的 跳 数 。 应 当 注 意 ， 如 果 所 有 权重 相等 ， 则 问题 是 相同 的 。 





Figure 2 


7.20.Dijkstra 算 法 


我 们 将 用 于 确定 最 短路 径 的 算法 称 为 “Dijkstra 算 法 "。Dijkstra 和 工法 是 一 种 迭代 莫 法 ， 它 为 我 们 
提供 从 一 个 特定 起 始 节点 到 图 中 所 有 其 他 节点 的 最 短路 径 。 这 也 类 似 于 广度 优先 搜索 的 结 
果 。 


为 了 跟踪 从 开始 节点 到 每 个 目的 地 的 总 成 本 ， 我 们 将 使 用 顶点 类 中 的 dist 实例 变量 。 dist 实 
例 变 量 将 包含 从 开始 到 所 讨论 的 顶点 的 最 小 权重 路 径 的 当前 总 权重 。 该 算法 对 图 中 的 每 个 顶 
点 重复 一 次 ;然而 ， 我 们 在 顶点 上 和 迭代 的 顺序 由 优先 级 队列 控制 。 用 于 确定 优先 级 队列 中 对 象 
顺序 的 值 为 dist。 当 首次 创建 顶点 时 ，dist 被 设置 为 非常 大 的 数 。 理 论 上 ， 你 将 dist 设置 为 无 
穷 大 ， 但 在 实践 中 ， 我 们 只 是 将 它 设置 为 一 个 数字 ， 大 于 任何 丨 正 的 距离 ， 我 们 将 在 问题 中 
试图 解决 。 


Dijkstra 算 法 的 代码 如 Listing 1 所 示 。 当 算法 完成 时 ， 距 离 设 置 正确 ， 如 图 中 每 个 顶点 的 前 导 
链接 一 样 


from pythonds.graphs import PriorityQueue, Graph, Vertex 
def dijkstra(aGraph, start): 
pq = PriorityQueue() 
start.setDistance(0) 
pq.buildHeap([(v.getDistance(),v) for v in aGraph]) 
while not pq.isEmpty(): 
currentVert = pq.delMin() 
for nextVert in currentVert.getConnections(): 
newDist = currentVert.getDistance() \ 
+ currentVert.getweight(nextVert ) 
if newDist < nextVert.getDistance(): 
nextVert.setDistance( newDist ) 
nextVert.setPred(currentVert) 
pq.decreaseKey(nextVert,newDist ) 


Listing 1 


Dijkstra 的 算法 使 用 优先 级 队列 。 你 可 能 还 记得 ， 优 先 级 队列 是 基于 我 们 在 树 章节 中 实现 的 
堆 。 这 个 简单 的 实现 和 我 们 用 于 Dijkstra 算 法 的 实现 之 间 有 几 个 区 别 。 首 先 ，PriorityQueue 类 
存储 键 值 对 的 元 组 。 这 对 于 Dijkstra 的 算法 很 重要 ， 因 为 优先 级 队列 中 的 键 必须 匹配 图 中 顶点 
的 键 。 其 次 ， 值 用 于 确定 优先 级 ， 并 且 用 于 确定 键 在 优先 级 队列 中 的 位 置 。 在 这 个 实现 中 ， 
我 们 使 用 到 顶点 的 距离 作为 优先 级 ， 因 为 我 们 看 到 当 探 索 下 一 个 顶点 时 ， 我 们 总 是 要 探索 具 
有 最 小 距离 的 顶点 。 第 二 个 区 别 是 增加 decreasekey 方法 。 正 如 你 看 到 的 ， 当 一 个 已 经 在 队 
列 中 的 顶点 的 距离 减 小 时 ， 使 用 这 个 方法 ， 将 该 顶点 移动 到 队列 的 前 面 。 


让 我 们 使 用 下 面 的 序列 图 像 作为 指导 ， 一 次 应 用 Dijkstra 算法 的 一 个 顶点 。 我 们 从 顶点 U 开 
始 。 与 U 相 邻 的 三 个 顶点 是 v，w 和 X。 由 于 到 v，w 和 X 的 初始 距离 都 被 初始 化 为 
sys.maxint ， 通 过 起 始 节点 获得 它们 的 新 成 本 都 是 它们 的 直接 成 本 。 因 此 ， 我 们 将 这 三 个 节 
点 中 的 每 一 个 成 本 更 新 。 我 们 还 将 每 个 节点 的 前 导 设 置 为 U， 并 将 每 个 节点 添加 到 优先 级 队 
列 。 我 们 使 用 距离 作为 优先 级 队列 的 键 。 算 法 的 状态 如 Figure 3 所 示 。 


在 while 循环 的 下 一 次 迭代 中 ， 我 们 检查 与 x 相 邻 的 顶点 。 顶 点 X 是 下 一 个 ， 因 为 它 具 有 最 
低 的 总 成 本 ， 因 此 冒 泡 到 E EAA 的 开始 。 在 X， 我 们 看 看 它 的 邻居 U，v，w 和 y。 对 于 每 
个 相 邻 顶点 ， 我 们 检查 通过 x 到 该 顶点 的 距离 是 否 小 于 先前 已 知 的 距离 。 显 然 ， 这 是 y 的 情 
况 ， 因 为 它 的 距离 是 sys.maxint。 这 不 是 U 或 Vv 的 情况 ， 因 为 它们 的 距离 分 别 为 0 和 2。 然 
而 ， 我 们 现在 知道 ， 如 果 我 们 经 过 x 而 不 是 从 U 直接 到 W， 到 w 的 距离 更 小 。 既 然 是 这 样 ， 
我 们 用 新 的 距离 更 新 Ww， 并 将 w 的 前 导 从 U 更 改 为 xX。 有关 所 有 顶点 的 状态 ， 请 参见 Figure 
4。 


下 一 步 是 查看 邻近 v 的 顶点 (参见 Figure 5) 。 此 步骤 不 会 对 图 形 进行 任何 更 改 ， 因 此 我 们 

继续 前 进 到 节点 yY。 在 节点 yY〈 见 Figure 6) ， 我 们 发 现 到 w 和 Z 都 更 小 ， 因 此 我 们 相应 地 调 
整 距 离 和 前 导 链接 。 最 后 ， 我 们 检查 节点 W 和 Zz (参见 Figure 6 和 Figure 8) 。 但 是 ， 没 有 
发 现 额 外 的 更 改 ， 因 此 优先 级 队列 为 室 ，Dijkstra 的 算法 退出 。 


7.20.Dijkstra 算 法 
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7.20.Dijkstra # = 





PQ = x,v,w 





PQ = ww 
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7.20.Dijkstra # = 





PQ = wz 





PQ =z 





PQ = None 
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重要 的 是 要 注意 ，Dijkstra 的 算法 只 有 当权 重 都 是 正 数 时 才 起 作用 。 如 果 你 在 图 的 边 引 入 一 个 
负 权 重 ， 算 法 永远 不 会 退出 。 

我 们 将 注意 到 ， 通 过 因特网 路 由 发 送 消息 ， 可 以 使 用 其 他 算法 来 找到 最 短路 径 。 在 互联 网 上 
使 用 Dijkstra 算法 的 一 个 问题 是 ， 为 了 使 算法 运行 ， 你 必须 有 一 个 完整 的 图 表示 。 这 意味 着 
每 个 路 由 器 都 有 一 个 完整 的 互联 网 中 所 有 路 由 器 地 图 。 实际 上 不 是 这 种 情况 ， 算 法 的 其 他 变 
种 允许 每 个 路 由 器 在 它们 发 送 时 发 现 图 。 你 可 能 想 要 了 解 的 一 种 这 样 的 算法 称 为 “距离 矢量 
路 由 算法 。 


7.21.Dijkstra 算 法 分 析 


最 后 ， 让 我 们 看 看 Dijkstra 算法 的 运行 时 间 。 我 们 首先 注意 到 ， 构 建 优 先 级 队列 需要 O(v) 时 
间 ， 因 为 我 们 最 初 将 图 中 的 每 个 顶点 添加 到 优先 级 队列 。 一 旦 构造 了 队列 ， 则 对 于 每 个 顶点 
执行 一 次 While 循环 ， 因 为 顶点 都 在 开始 处 添加 ， 并 且 在 那 之 后 才 被 移 除 。 在 该 循环 中 每 次 
调用 delMin， 需 要 O(log^V ) 时 间 。 将 该 部 分 循环 和 对 delMin 的 调用 取 为 O(Vlog^V )。 for 
循环 对 于 图 中 的 每 个 边 执行 一 次 ， 并 且 在 for 循环 中 ， 对 decreaseKey 的 调用 需要 时 间 
O(Elog^V) 。 因此 ， 组 合 运行 时 间 为 O((V + E)logV )。 


7.22.Prim 生 成 树 算 法 


对 于 我 们 最 后 的 图 算法 ， 让 我 们 考虑 一 个 在 线 游戏 设计 师 和 网 络 收音 机 提供 商 面临 的 问题 。 
问题 是 他 们 想 有 效 地 将 一 条 信息 传递 给 任何 人 和 每 个 可 能 在 听 的 人 。 这 在 游戏 中 是 重要 的 ， 
使 得 所 有 玩家 知道 每 个 其 他 玩家 的 最 新 位 置 。 对 于 网 络 收音 机 是 重要 的 ， 以 便 所 有 该 调频 的 
收听 者 获得 他 们 需要 的 所 有 数据 来 刷新 他 们 正在 收听 的 歌曲 。 Figure 9 说 明了 广播 问题 。 
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Listener Listener 


Figure 9 


这 个 问题 有 一 些 强力 的 解决 方案 ， 所 以 先 看 看 他 们 如 何 更 好 地 理解 广播 问题 。 这 也 将 帮助 你 
理解 我 们 最 后 提出 的 解决 方案 。 首 先 ， 广 播 主 机 有 一 些 收听 者 都 需要 接收 的 信息 。 最 简单 的 
解决 方案 是 广播 主机 保存 所 有 收听 者 的 列表 并 向 每 个 收听 者 发 送 单独 的 消息 。 在 Figure 9 
中 ， 我 们 展示 了 有 广播 公司 和 一 些 收听 者 的 小 型 网 络 。 使 用 第 一 种 方法 ， 将 发 送 每 个 消息 的 
四 个 副本 。 假 设 使 用 最 小 成 本 路 径 ， 让 我 们 看 看 每 个 路 由 器 处 理 同一 消息 的 次 数 。 


来 自 广播 公司 的 所 有 消息 都 通过 路 由 器 A， 所 以 A 看 到 每 个 消息 的 所 有 四 个 副本 。 路 由 器 C 
只 接收 到 其 收听 者 每 个 消息 的 一 个 副本 。 然 而 ， 路 由 器 B 和 D 将 收 到 每 个 消息 的 三 个 副本 ， 
因为 路 由 器 ae ele i aa 当 广 播 主机 必须 每 秒 发 送 数 百 条 消息 用 
于 无 线 电 广播 ， 这 是 很 多 额外 的 流量 。 


暴力 解决 方案 是 广播 主机 发 送 广播 消息 的 单个 副本 ， 并 让 路 由 器 整理 出 来 。 在 这 种 情况 下 ， 

最 简单 的 解决 方案 是 称 为 ”不 受 控 泛 洪 的 策略 。 洪 水 策略 工作 如 下 。 每 个 消息 开始 于 将 存活 时 
间 (ttl) 值 设置 为 大 于 或 等 于 广播 主机 与 其 最 远 听 者 之 问 的 边 数量 的 某 个 数 。 每 个 路 由 器 获得 
消息 的 副本 ， 并 将 消息 传递 到 其 所 有 相 邻 路 由 器 。 当 消息 传递 到 划 减少 。 每 个 路 由 器 继续 向 
其 所 有 邻居 发 送 消息 的 副本 ， 直 到 ttl 值 达 到 0。 不 受 控制 的 洪 泛 比 我 们 的 第 一 个 策略 产生 更 
多 的 不 必要 的 消息 。 


这 个 问题 的 解决 方案 在 于 建立 最 小 权重 生成 桂 。 正 式 地 ， 我 们 为 图 G= (V，E) 定义 最 小 生 
成 树 下 如 下 。 下 是 连接 V 中 所 有 顶点 的 EE 的 非 循环 子 集 。T 中 的 边 的 权重 的 和 被 最 小 化 。 
Figure 10 展示 了 广播 图 的 简化 版 本 并 突出 了 生成 图 的 最 小 生成 树 的 边 。 现 在 为 了 解决 我 们 的 
广播 问题 ， 广 播 主 机 简单 地 将 广播 消息 的 单个 副本 发 送 到 网 络 中 。 每 个 路 由 器 将 消息 转发 到 
作为 生成 树 的 一 部 分 邻居 ， 排 除 刚刚 向 其 发 送 消息 的 邻居 。 在 这 个 例子 中 A 将 消息 转发 到 
B，B 将 消息 转发 到 D 和 C。D 将 消息 转发 到 E，E 将 它 转发 到 F，F 转发 到 G。 没 有 路 由 器 
看 到 任何 消息 的 多 个 副本 ， 所 有 感 兴趣 的 收听 者 都 会 看 到 消息 的 副本 。 
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Figure 10 


我 们 将 用 来 解决 这 个 问题 的 算法 称 为 Prim 算法 。 Prim 算法 属于 称 为 “ 贪 焚 算法 ”一 系列 算 
法 ，， 因 为 在 每 个 步 又， 我 们 将 选择 最 小 权重 的 下 一 步 。 在 这 种 情况 下 ， 最 小 权重 的 下 一 步 
是 以 最 小 的 权重 跟随 边 。 我 们 的 最 后 一 步 是 开发 Prim 算法 。 


构建 生成 树 的 基本 思想 如 


While T is not yet a spanning tree 
Find an edge that is safe to add to the tree 
Add the new edge to T 


诀窍 是 指导 我 们 “找到 一 个 安全 的 边 ”。 我 们 定义 一 个 安全 边 作 为 将 生成 树 中 的 顶点 连接 到 不 
在 生成 树 中 的 顶点 的 任何 边 。 这 确保 树 将 始终 保持 为 树 并 且 没 有 循环 。 


用 于 实现 Prim 算法 的 Python 代码 如 Listing2 所 示 。Prim 算法 类 似 于 Dijkstra 算法 ， 它 们 都 
使 用 优先 级 队列 来 选择 要 添加 到 图 中 的 下 一 个 顶点 。 


from pythonds.graphs import PriorityQueue, Graph, Vertex 


def prim(G, start): 
pq = PriorityQueue() 
for v in G: 
v.setDistance(sys.maxsize) 
v.setPred(None) 
start.setDistance(0) 
pq.buildHeap([(v.getDistance(),v) for v in G]) 
while not pq.isEmpty(): 
currentVert = pq.delMin() 
for nextVert in currentVert.getConnections(): 
newCost = currentVert.getWeight(nextVert ) 
if nextVert in pq and newCost<nextVert.getDistance(): 
nextVert.setPred(currentvVert) 
nextVert.setDistance(newCost) 
pq.decreaseKey(nextVert,newCost ) 


Listing 2 


下 面 的 图 (Figure 11 到 Figure 17) 展示 了 在 我 们 的 样本 树 上 运行 的 莫 法 。 我 们 从 起 始 顶点 开 
始 。 到 所 有 其 他 顶点 的 距离 被 初始 化 为 无 穷 大 。 看 看 A 的 邻居 ， 我 们 可 以 更 新 另外 两 个 顶点 
B 和 C 的 距离 ， 因 为 通过 A 到 B 和 C 的 距离 小 于 无 限 。 这 将 B 和 C 移动 到 优先 级 队列 的 前 
面 。 通 过 将 B 和 C 的 前 导 链 接 设置 为 指向 A 来 更 新 前 导 链 接 。 重 要 的 是 要 注意 ， 我 们 还 没有 
正式 向 生成 树 添加 BB 或 C。 在 将 节点 从 优先 级 队列 中 删除 之 前 ， 不 会 将 其 视 为 生成 树 的 一 部 


分 。 


因为 B 有 最 小 的 距离 ， 我 们 看 看 B。 检 查 B 的 邻居 ， 我 们 看 到 D 和 E 可 以 更 新 。D 和 E 都 
获得 新 的 距离 值 ， 并 更 新 它们 的 前 导 链 接 。 移 动 到 优先 级 队列 中 的 下 一 个 节点 ， 我 们 找到 
C。 只 有 仍 在 优先 级 队列 中 的 节点 是 下 ， 因 此 我 们 可 以 更 新 到 下 的 距离 ， 并 调整 优先 级 队列 中 
的 F 的 位 置 。 


现在 我 们 检查 与 节点 D 相 邻 的 顶点 。 我 们 发 现 可 以 更 新 E 并 且 将 从 距离 6 减 小 到 4。 当 我 们 
这 样 做 时 ， 我 们 将 E 上 的 前 趋 链接 改变 为 指向 D， 从 而 准备 移植 到 生成 树 中 不 同 的 位 置 。 算 
法 的 其 余部 分 按照 预期 进行 ， 将 每 个 新 节点 添加 到 树 中 。 
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7.23. 总 结 


在 本 章 中 ， 我 们 讨论 了 图 抽象 数据 类 型 ， 以 及 图 的 一 些 实现 。 图 使 我 们 能 够 解决 许多 问题 ， 
只 要 我 们 可 以 将 原始 问题 转换 为 可 以 由 图 表示 的 东西 。 特别 是 ， 我 们 已 经 看 到 ， 图 有 助 于 角 
决 以 下 领域 的 问题 。 


© 广度 优先 搜索 找到 未 加 权 的 最 短路 径 。 
© Dijkstra 的 加 权 最 短路 径 算 法 。 

o 深度 优先 搜索 图 探索 。 

e 强 连 通 分 量 ， 用 于 简化 图 。 

© 排序 任务 的 拓扑 排序 。 

。 广播 消息 的 最 小 权重 生成 树 。 


